طريقة جديدة لتحديد العلاقات السببية في البيانات البيولوجية متعددة الوسائط

Wednesday, April 23, 2025

تعمل يويون سون، وهي باحثة ما بعد الدكتوراة في جامعة محمد بن زايد للذكاء الاصطناعي، في أحد مجالات تعلم الآلة يُعرَف باسم التعلم بالتمثيل السببي ويركز على تحديد كيفية تأثير المتغيرات الخفية أو الكامنة في الأنظمة المعقدة.

وقد نشرت مؤخراً، بالاشتراك مع زملائها من جامعة محمد بن زايد للذكاء الاصطناعي ومؤسسات أخرى، دراسة جديدة تعالج تحدياً مهماً في مجال البحوث الطبية، وهو كيفية تحديد العوامل السببية الأساسية عندما تكون البيانات القابلة للملاحظة انعكاسات غير مباشرة لآليات بيولوجية أعمق، كما في حالة نتائج الفحوص المخبرية، والمعلومات الجينية، والصور الطبية. ويزداد الأمر صعوبة عندما تكون البيانات الطبية متعددة الوسائط، بمعنى أنها تشمل صوراً وجداول وسلاسل زمنية. فمعظم أساليب تعلم الآلة الحالية لم تُصمم لاكتشاف العلاقات السببية في هذه الأنماط المتنوعة من البيانات.

قدمت سون وزملاؤها في دراستهم طريقة جديدة للتغب على هذا التحدي. ومن خلال تطبيق هذه الطريقة على مجموعات بيانات اصطناعية وحقيقية، أثبت الباحثون قدرة نموذجهم على تحديد المتغيرات السببية الكامنة وتأثيرها في النتائج البيولوجية المُلاحظة. كما تمكنوا من تحليل تأثير الآليات السببية عبر وسائط مختلفة.

توضح سون ذلك بقولها: “تحلل أساليب تعلم الآلة التقليدية كل نوع من البيانات على حدة وتستخلص منها النتائج. ولكن هذه الأساليب قد تُغفل التفاعلات بين الوسائط المختلفة، مما يجعل النتائج ناقصة أو حتى مضللة”.

سيعرض الفريق البحثي النتائج التي توصل إليها في الدورة الثالثة عشرة للمؤتمر الدولي لتعلم التمثيلات التي ستعقد في سنغافورة في نهاية إبريل. وقد ساهم في إعداد الدراسة كل من غوانغي تشن، ولوكا لي، وغونغشو لوو، وزيجيان لي، وييشوان زانغ، وإيران سيغال، وإريك زينغ، وكون زانغ من جامعة محمد بن زايد للذكاء الاصطناعي.

التحليل متعدد الوسائط وقابلية التفسير

كان هدف الفريق البحثي هو تحديد المتغيرات السببية الكامنة والعلاقات بينها. في علم الأحياء، قد تشمل المتغيرات الكامنة خصائص جينية أو ظواهر بيولوجية لا يمكن قياسها بشكل مباشر لكنها تؤثر في البيانات القابلة للملاحظة.

عندما يطور الباحثون طرق التعلم بالتمثيل السببي، فإنهم يضعون فرضيات بشأن كيفية تفسير نماذجهم للبيانات. ولكن الكثير من الطرق السابقة لتحليل مجموعات البيانات متعددة الوسائط تتسم بشيء من القصور، فهي إما تقوم على افتراضات غير واقعية، مثل افتراض استقلالية المتغيرات الكامنة أو افتراض نمط معين من العلاقات، أو تقتصر على تحقيق قابلية التعرف بشكل جزئي، مما يجعل من الصعب تحديد العلاقات السببية المعقدة التي تمتد عبر وسائط مختلفة.

في المقابل، اتبعت سون وزملاؤها طريقة أكثر مرونة، حيث افترضوا أن المتغيرات السببية الكامنة في وسيط معين سيكون لها تأثير في المتغيرات الكامنة في وسيط آخر، ولكن هذه العلاقات ستكون متناثرة، بمعنى أن كل متغير يؤثر فقط في عدد قليل من المتغيرات الأخرى.

يسعى علماء تعلم الآلة عادة إلى تطوير أنظمة قابلة للتفسير، بمعنى أن يستطيع البشر فهم كيفية وصولها إلى نتائجها. إلا أن العديد من النماذج الحالية أشبه بصناديق سوداء، وهو أمر قد يكون مقبولاً في بعض الحالات التي لا تترتب عليها مخاطر كبيرة، مثل التوصيات في منصات البث. ولكن الوضع يختلف في حالة الأنظمة المصممة لتحليل البيانات البيولوجية، حيث يحتاج الباحثون والأطباء إلى أنظمة تساعدهم على فهم كيفية الوصول إلى النتائج. وفي هذا السياق تؤكد سون أنه “في حالة القرارات الطبية، نحتاج إلى وجود مسار سببي يوضح كيفية وصول الآلة إلى استنتاجاتها”.

اختبار النموذج

اختبر الفريق طريقته على مجموعات بيانات اصطناعية وعلى مجموعة بيانات حقيقية تحتوي على قياسات صحية للبشر. وفي كلتا الحالتين، تمكن النموذج من تحديد المتغيرات السببية الكامنة ورسم العلاقات بينها بدقة أعلى من الطرق الحالية.

تلعب مجموعات البيانات الاصطناعية دوراً مهماً في مجال التعلم بالتمثيل السببي من خلال توفير عنصر الحقيقة المؤكدة الذي يكون غائباً عادة في مجموعات البيانات الحقيقية. استخدم الباحثون نموذجهم لتحليل مجموعات البيانات الاصطناعية، وقارنوا النتائج بالحقيقة المؤكدة، فوجدوا أن النموذج نجح في تحديد العلاقات السببية بين المتغيرات الكامنة.

أما في مجموعة البيانات الحقيقية، فقد تمكن النموذج من تحديد العلاقات بين الوسائط بشكل يتوافق مع النتائج الطبية المعروفة. على سبيل المثال، اكتشف النموذج وجود علاقة سببية بين أنماط النوم ومستويات الأوكسجين في الدم، وأن العمر يؤثر على صحة العين. كما كشف عن علاقة أقل وضوحاً بين صور العين وقوة قبضة اليد، وهي علاقة سبق أن اكتشفها الباحثون الطبيون.

بصورة عامة، تُظهر دراسة الفريق كيف يمكن لنظام تعلم آلة يتميز بقدر أكبر من المرونة وقابلية التفسير أن يعزز قدرة العلماء على فهم البيانات البيولوجية المعقدة، مما يفتح المجال لتطوير أنظمة ذكاء اصطناعي أكثر شفافية وموثوقية لأغراض البحث العلمي واتخاذ القرارات الطبية.

فوائد البحوث متعددة التخصصات

قبل أن تتجه سون إلى مجال التعلم بالتمثيل السببي، كانت تركز على اكتشاف العلاقات السببية، وهو مجال قريب يهدف إلى تحديد العلاقات السببية بين المتغيرات القابلة للملاحظة في البيانات. ولكنها انتقلت إلى مجال التعلم بالتمثيل السببي لأنه يتعامل مع الحالات التي لا تُلاحظ فيها المتغيرات السببية الحقيقية بشكل مباشر، بل يجب استنتاجها من خلال الملاحظة، وهو أمر شائع في مجموعات البيانات الحقيقية. وتؤكد سون أنه: “عندما تكون لدينا مجموعات ضخمة من البيانات القابلة للملاحظة، فلا بد أن تكون هناك متغيرات كامنة مؤثرة”.

وتشير سون إلى أن هذه الدراسة تمت بالتعاون مع باحثين من جامعة كارنيجي ميلون وجامعة بريستول ومعهد برود التابع لمعهد ماساتشوستس للتكنولوجيا وجامعة هارفارد، وهو من أبرز المراكز العالمية التي تركز على تحسين صحة الإنسان. ومن خلال هذا التعاون، تعرّفت سون على أبرز الأسئلة الملحة التي يسعى الباحثون الطبيون إلى الإجابة عليها حالياً، بينما تعرّف الباحثون الطبيون في المقابل على أحدث التطورات في مجال دراسة العلاقات السببية.

تعبّر سون عن أملها في أن تتمكن في المستقبل من بناء مزيد من الجسور بين هذين المجالين، وأن تجري “أبحاثاً لا تقتصر فوائدها على المختصين بدراسة العلاقات السببية، بل تستفيد منها مجموعة أكبر من العلماء”.

أخبار ذات صلة

thumbnail
Tuesday, April 15, 2025

اختبار جديد للكشف عن العلاقات الخفية في البيانات يُعرض في المؤتمر الدولي لتعلم التمثيلات

يسعى الباحثون في كثير من المجالات إلى فهم العلاقات بين المتغيرات المختلفة في البيانات. ففي مجال التمويل.....

  1. تعلّم الآلة ,
  2. المؤتمرات ,
  3. الإحصاء ,
  4. البيانات ,
  5. المتغيرات ,
  6. ICLR ,
  7. البحوث ,
اقرأ المزيد
thumbnail
Monday, March 24, 2025

جامعة محمد بن زايد للذكاء الاصطناعي وجامعة بيركلي تستشرفان مستقبل تعلم الآلة

جامعة محمد بن زايد للذكاء الاصطناعي تستضيف ورشة عمل مشتركة مع جامعة بيركلي تحت عنوان "الاتجاهات الناشئة.....

  1. تعلّم الآلة ,
  2. الابتكار ,
  3. الأبحاث ,
  4. التعاون ,
  5. ورشة عمل ,
  6. جامعة بيركلي ,
اقرأ المزيد