اختبار جديد للكشف عن العلاقات الخفية في البيانات يُعرض في المؤتمر الدولي لتعلم التمثيلات

Tuesday, April 15, 2025

يسعى الباحثون في كثير من المجالات إلى فهم العلاقات بين المتغيرات المختلفة في البيانات. ففي مجال التمويل مثلاً، قد يبحث المحللون فيما إذا كان سعر أصل معين يؤثر في سعر أصل آخر أو أنّهما مستقلان عن بعضهما. وفي مجال الصحة العامة، قد يهتم الباحثون بتحديد دور عوامل بيئية أو سلوكية معينة في نشوء الأمراض لدى مجموعات سكانية محددة.

ولكن تحديد العلاقات السببية بين المتغيرات أمر شديد الصعوبة. ولذلك يعمل العلماء باستمرار على إيجاد طرق إحصائية وأساليب لتعلّم الآلة بهدف تحسين هذه العملية. أحد المفاهيم الأساسية في هذا المجال هو الاستقلالية الشرطية، الذي يساعد الباحثين في معرفة ما إذا كان متغير ما يؤثر فعلاً في متغير آخر.

وقد طور العلماء طرقاً لتحديد الاستقلالية الشرطية، ولكنها ليست فعالة في جميع الحالات.

تحتوي مجموعات البيانات غالباً على مزيج مما يُعرف بالمتغيرات المستمرة، وهي القيم التي تقع ضمن نطاق معين، والمتغيرات المنفصلة، وهي الفئات التصنيفية. وقد تكون المتغيرات المنفصلة منفصلة بطبيعتها، مثل كون الشخص مدخناً أو غير مدخن، أو صوراً مبسطة لمتغيرات مستمرة في الأصل.

يوضح بويانغ سون، طالب الدكتوراة في قسم تعلم الآلة بجامعة محمد بن زايد للذكاء الاصطناعي، أن الاختبارات الحالية للاستقلالية الشرطية تفترض أن المتغيرات المنفصلة منفصلة بطبيعتها، ولكنه يشير إلى أن “هناك حالات يكون فيها المتغير الأساسي مستمراً، كما في شدة مرض السرطان، التي تُسجل غالباً على شكل مراحل مثل “المرحلة الأولى” و”المرحلة الثانية” وهكذا. وفي هذه الحالات، قد يؤدي استخدام الطرق الحالية إلى نتائج مضللة”.

لمعالجة هذا الأمر، طوّر سون وزملاؤه في جامعة محمد بن زايد للذكاء الاصطناعي ومؤسسات أخرى اختباراً جديداً للاستقلالية الشرطية يتعامل مع سيناريو مهم لكنه مُهمَل في الأبحاث، وهو الحالات التي تكون فيها المتغيرات مستمرة بطبيعتها لكنها ممثلة بشكل منفصل بسبب قيود جمع البيانات. ويؤكد سون أن “هذا البحث يعالج مشكلة جوهرية في مجالي تعلم الآلة والإحصاء”.

سيعرض الفريق النتائج التي توصل إليها في الدورة الثالثة عشرة للمؤتمر الدولي لتعلم التمثيلات التي ستعقد في سنغافورة في وقت لاحق من هذا الشهر. وقد ساهم في إعداد الدراسة كلٌّ من غوانغيوان هاو وكون زانغ من جامعة محمد بن زايد للذكاء الاصطناعي.

فهم المتغيرات المنفصلة

أطلق سون وزملاؤه على طريقتهم الجديدة اسم “اختبار الاستقلالية الشرطية مع مراعاة الفصل”، وهي تسمح بتحديد العلاقة بين متغيرين سواء كانا منفصلين، أو مستمرين، أو أحدهما منفصل والآخر مستمر. يقول سون في هذا الصدد: “هناك الكثير من اختبارات الاستقلالية الشرطية الفعالة في حالة البيانات المستمرة، ولكن لا يوجد اختبارات يمكن أن تحدد بشكل صحيح العلاقات بين المتغيرات المستمرة الكامنة عندما لا نلاحظ إلا نسخاً منفصلة منها”.

يؤكد سون على أهمية تحديد ما إذا بعض المتغيرات يؤثر في بعضها الآخر، خصوصاً في مجموعات البيانات الضخمة، حيث يصبح من الضروري التركيز على المتغيرات المهمة فقط، حيث يقول: “إذا كان الرسم البياني مليئاً بالخطوط المتشابكة، وحاولنا دراسة جميع المتغيرات، فلن يكون ذلك ممكناً بسبب العدد الهائل من العمليات الحسابية اللازمة. والطريقة الأنجع هي تحديد المتغيرات المرتبطة بغيرها، مما يجعل الحسابات أبسط بكثير”.

تجربة اختبار الاستقلالية الشرطية مع مراعاة الفصل

اختبر الباحثون طريقتهم على مجموعات بيانات اصطناعية وحقيقية. كانت الخطوة الأولى هي محاولة استرجاع المتغيرات المستمرة الأساسية أو الكامنة من صورها المنفصلة، وذلك باستخدام أساليب إحصائية لتقدير التباين بين النوعين، بهدف تقييم مدى دقة تمثيل المتغيرات المنفصلة للمتغيرات المستمرة الكامنة. ثم استخدم الباحثون نوعاً من تحليل الانحدار يُعرف باسم “الانحدار العقدي” لاختبار الاستقلالية الشرطية استناداً إلى التباين المقدَّر.

يقوم نهج الفريق على افتراض أن المتغيرات المستمرة الكامنة موزعة توزيعاً طبيعياً (توزيع جاوسي)، وهو نهج شائع ومفيد، بحسب سون، مما سمح للباحثين بحساب ما ستكون عليه نتائج الاختبار لو كانت المتغيرات مستقلة فعلاً.

النتائج والدلالات

حققت طريقة سون وزملائه أداء أفضل من الاختبارات الحالية الأخرى في الكشف عن العلاقات بين المتغيرات، مما يؤكد إمكانية استخدامها في مجال اكتشاف العلاقات السببية، الذي يعتمد اعتماداً كبيراً على تحديد الاستقلالية الشرطية للمتغيرات. يقول سون: “إذا كنت مهتماً باكتشاف العلاقات السببية، فعليك استخدام اختبار الاستقلالية الشرطية لاستبعاد الحواف أو الروابط بين المتغيرات بشكل متسلسل بهدف الكشف عن العلاقات الحقيقية بينها”.

يشير سون إلى أن هذا البحث، إلى جانب مساهمته في النواحي الفنية، ساعده أيضاً في توسيع نظرته إلى دور الرياضيات وتعميق فهمه لتأثيرها في مجالي تعلم الآلة والإحصاء، حيث يقول: “هذا البحث جعلني أدرك أن الرياضيات علم أساسي ومهم جداً، ومع ذلك ما زال هناك العديد من المسائل التي يجب حلها”.

أخبار ذات صلة

thumbnail
Thursday, January 23, 2025

توقع إنتاج المحاصيل في ظل التغيرات المناخية والأحوال الجوية الاستثنائية

الدكتور فخري كراي يسهم في تطوير نموذج إحصائي جديد قد يساعد في تحسين مستويات الاستدامة وجودة النظم.....

  1. التوقعات ,
  2. تعلّم الآلة ,
  3. الاستدامة ,
  4. الإحصائيات ,
  5. المناخ ,
  6. البيئة ,
  7. الغداء ,
اقرأ المزيد
thumbnail
Monday, January 06, 2025

تسريع عملية تحسين الشبكات العصبية: مقاربات جديدة ومبتكرة

فريق من جامعة محمد بن زايد للذكاء الاصطناعي يعرض مقاربة جديدة لتسريع عملية تحسين الشبكات العصبية خلال.....

  1. طرق الدرجة الثانية ,
  2. التحسين ,
  3. الشبكات العصبية ,
  4. الطلبة ,
  5. البحث ,
  6. neurips ,
اقرأ المزيد