طريقة جديدة لاكتشاف علاقات التبعية النادرة في البيانات - MBZUAI MBZUAI

طريقة جديدة لاكتشاف علاقات التبعية النادرة في البيانات

الاثنين، 11 أغسطس 2025

يُعدّ تحديد أنماط العلاقات التبعية في البيانات أمراً أساسياً في مجالات متنوّعة مثل الصحة العامة والاقتصاد وعلم الجينوم واكتشاف العلاقات السببية، لأن هذه الأنماط تبيّن كيفية تأثير أحد المتغيرات على المتغيرات الأخرى. ورغم تطوير عدة طرق لتحديد هذه الأنماط، إلا أن هناك حالات تكون فيها العلاقات التبعية في أجزاء صغيرة من البيانات مختلفة عما هي عليه في معظم مجموعة البيانات ولا تفلح الطرق الحالية في تحديدها. لذلك أعد باحثون من جامعة محمد بن زايد للذكاء الاصطناعي ومؤسسات أخرى دراسة حديثة تركز على هذه النوع من العلاقات التبعية التي تُربك الكثير من أدوات تحليل البيانات المستخدمة حالياً، والتي أطلق عليها الباحثون اسم “التبعية النادرة”.

لمعالجة مشكلة التبعية النادرة، ابتكر الباحثون طريقة جديدة يمكن استخدامها في مختلف المجالات التي يجري فيها تحليل البيانات القابلة للملاحظة. وتعتمد هذه الطريقة على اختبار الاستقلالية الشرطية باستخدام دالات النواة عبر إعادة وزن العينات وفقاً لأهميتها، مما يتيح تحديد مواضع البيانات التي تظهر فيها تبعية نادرة ومنحها وزناً أكبر نسبياً.

اختبر الفريق خوارزميته على بيانات اصطناعية وبيانات واقعية، فوجد أنها نجحت في تحديد العلاقات بين المتغيرات حتى مع وجود حالات تبعية نادرة، وهو ما يبرهن على الإمكانات الواعدة لهذه الطريقة في مساعدة الباحثين على استخلاص رؤى أعمق من تحليل البيانات.

وقد عرضت ييتشينغ لي، الباحثة المساعدة في جامعة محمد بن زايد للذكاء الاصطناعي والمشاركة في إعداد الدراسة، هذه النتائج في المؤتمر الدولي لتعلم الآلة الذي عقد في فانكوفر. وشارك معها في إعداد الدراسة كل من ييواي شيا، وشياوفي وانغ، وتشنغمنغ تشن، وليوهوا بنغ، ومينمينغ غونغ، وكون زانغ.

وجه الصعوبة في التبعية النادرة

توجد التبعية النادرة في مجموعات البيانات الواقعية، ويمكن أن تسبب مشاكل في المجالات المرتبطة بالذكاء الاصطناعي مثل الاستدلال السببي، واختيار الخصائص، والتعلّم الذاتي الخاضع للإشراف. ففي الطب، قد يكون لبعض الأدوية تأثيرات غير متوقعة لا تظهر إلا في شريحة صغيرة من المرضى. على سبيل المثال، تبين أن الأفيونات قد تؤدي إلى تفاقم الألم لدى بعض المرضى. في هذه الحالات، لا تحقق اختبارات الاستقلالية الحالية الفائدة المرجوة.

تقول لي وزملاؤها إن طريقتهم تركّز مزيداً من “الانتباه على العينات التابعة وتكشف بنجاح حالات التبعية النادرة”، حيث تُمنح نقاط البيانات التي تُظهر أنماط تبعية أوضح وزناً أكبر بشكل تلقائي.

اختبر الباحثون طريقتهم على مجموعتي بيانات اصطناعيتين وقارنوها بعدة اختبارات استقلالية أخرى، بما في ذلك معيار استقلالية هيلبرت شميدت، الذي يولي نفس القدر من الانتباه لجميع العينات في مجموعة البيانات.

وأظهرت النتائج أن طريقتهم تمكنت من ضبط الأخطاء من النوع الأول، أي الحالات التي تشير فيها نتيجة الاختبار إلى وجود علاقة تبعية غير موجودة فعلياً، وذلك مع تحقيق نتيجة اختبار أعلى في الحالتين. ويؤكد الباحثون أن هذا يثبت الحاجة إلى إعادة وزن مجموعة فرعية من العينات في حالات التبعية النادرة.

مخطط مبعثر لنقاط البيانات التي ولّدها الباحثون لتقييم اختبارات الاستقلالية في وجود التبعية النادرة، وذلك في المستطيل الأحمر. أما اختبارات الاستقلالية التقليدية مثل معيار استقلالية هيلبرت شميدت فتتعامل مع العينة بالكامل بنفس الطريقة، مما قد يؤدي إلى نتائج مضللة.

مخطط مبعثر لنقاط البيانات التي ولّدها الباحثون لتقييم اختبارات الاستقلالية في وجود التبعية النادرة، وذلك في المستطيل الأحمر. أما اختبارات الاستقلالية التقليدية مثل معيار استقلالية هيلبرت شميدت فتتعامل مع العينة بالكامل بنفس الطريقة، مما قد يؤدي إلى نتائج مضللة.

كما اختبر الباحثون طريقتهم على مجموعة بيانات واقعية صادرة عن الاحتياطي الفيدرالي الأمريكي خلال الفترة من 1990 إلى 2010 وشملت متغيرين: سعر صرف الين الياباني مقابل الدولار الأمريكي، وسعر الفائدة المعتمد لدى الاحتياطي الفيدرالي الأمريكي، وهو مؤشر على صحة الاقتصاد بشكل عام.

وأظهرت النتائج أن طريقتهم كشفت عن وجود احتمال كبير لعلاقة تبعية بين المتغيرين، بينما فشل اختبار معيار استقلالية هيلبرت شميدت في نفي الاستقلالية بينهما. والأهم من ذلك هو أن طريقتهم حققت ذلك بشكل قابل للتفسير، حيث حددت عامي 2001 و2008، اللذين شهدا اضطرابات اقتصادية كبرى، كمثالين واضحين على التبعية النادرة.

توضح لي أهمية الطريقة الجديدة قائلة: “يريد الناس معرفة كيفية حدوث الأزمات الاقتصادية وأسبابها وكيفية تفاديها، لكن عدد نقاط البيانات المتاحة عن الأزمات المالية قليل. في هذه السيناريوهات تفشل الطرق التقليدية، وهنا يمكن لطريقتنا أن تقدم قيمة حقيقية”.

وتقر لي بأنه على الرغم من هذه النتائج الواعدة، هناك تراجع في مستوى الكفاءة، لأن الطريقة الجديدة تتطلب أولاً تحديد العينات التي يجب التركيز عليها. وتضيف: “يجب علينا تحسين الطريقة للوصول إلى أفضل دالة لإعادة الوزن، ثم تضخيم العينات الأكثر إفادة لاكتشاف حالات التبعية النادرة. أما الطرق التقليدية فيمكنها اختبار الاستقلالية بشكل مباشر، مما يسرع العملية. كما أن اختبار كامل البيانات يمكن أن يقدم معلومات مهمة”.

وطوّر الباحثون أيضاً نسخة معدلة من طريقتهم مخصصة لاختبار الاستقلالية الشرطية، ودمجوا الاختبارات المقترحة مع خوارزمية PC، وهي من أكثر الخوارزميات شيوعاً في مجال اكتشاف العلاقات السببية. وأطلقوا على هذه النسخة اسم “اختبار PC للتبعية النادرة، وهي تتيح التعلّم الصحيح للفئة المكافئة من الرسوم البيانية السببية بالاعتماد على البيانات القابلة للملاحظة حتى في وجود حالات التبعية النادرة.

ما الخطوة التالية؟

تقول لي إن هناك عدّة مسارات محتملة للبحوث المستقبلية في هذا الاتجاه، أحدها يتمثل في محاولة فهم الآلية الدقيقة التي تؤدي إلى ظهور التبعية النادرة في بعض مجموعات البيانات، والظروف التي تسهم في نشوء هذه العلاقات.

وهي تشجّع الباحثين الآخرين على تجربة هذه الطريقة الجديدة، قائلة: “عندما تواجهون مجموعة بيانات قد تحتوي على علاقات تبعية نادرة، نرجو أن تجرّبوا طريقتنا”.

أخبار ذات صلة

thumbnail
الأربعاء، 03 سبتمبر 2025

جامعة محمد بن زايد للذكاء الاصطناعي تفتح باب القبول لفصل خريف 2026

ترحب أول جامعة في العالم مكرَّسة للذكاء الاصطناعي بالطلاب المتميزين من مختلف أنحاء العالم للانضمام إلى برامجها.....

  1. Undergraduate ,
  2. intake ,
  3. post-graduate ,
  4. Bachelor's ,
  5. master's ,
  6. applications ,
  7. students ,
  8. graduates ,
  9. Ph.D. ,
اقرأ المزيد
thumbnail
الجمعة، 15 أغسطس 2025

رحلة دانيال غِبري من إريتريا إلى التفوق في الإمارات

بالنسبة لكثير من خريجي جامعة محمد بن زايد للذكاء الاصطناعي، يُمثّل ارتداء العباءة والقبعة في يوم التخرج.....

  1. تعلّم الآلة ,
  2. الخريجون ,
  3. الوصول ,
  4. دفعة عام 2025 ,
  5. التخرج ,
  6. حفل التخرج 2025 ,
  7. الموارد المنخفضة ,
اقرأ المزيد
thumbnail
الخميس، 07 أغسطس 2025

على خطى عرّاب الذكاء الاصطناعي

عندما وصل روهيت بهارادواج إلى إدنبرة لبدء دراسة الدكتوراة في علوم المعلوماتية، لم يكن يلتحق بواحدة من.....

  1. الدكتوراه ,
  2. الخريجون ,
  3. أخبار الخريجين ,
  4. مجموعة البيانات ,
  5. الخصوصية ,
اقرأ المزيد