تكنولوجيا تعلم الآلة في خدمة تشخيص المصابين بالسرطان

Thursday, October 24, 2024

رغم التقدم المُحرز في علاجه، يظل السرطان من أكثر الأمراض فتكاً، حيث تُسجَّل – وفقاً لإحصائيات منظمة الصحة العالمية – أكثر من 10 ملايين حالة وفاة بسببه في جميع أنحاء المعمورة، وهذا العدد – للأسف – مرشح للارتفاع. وتتوقع المنظمة نفسها بحلول عام 2040 أن يصل عدد حالات الوفيات إلى 30 مليون شخص سنوياً بسبب الإصابة بالسرطان.

الملاحظ، عندما يُشخص مريض بالسرطان، أن الأطباء يلجؤون إلى استخدام آليات إحصائية تعرف بـ ’نماذج تحليل البقاء‘ لمساعدتهم في توقع مسار تطور الحالة. وتؤثر – بالطبع – هذه التوقعات التي تتيحها هذه الآليات في الكيفية التي يتخذ بها الأطباء القرارات العلاجية. كما أن دقة التوقعات التي تنتجها هذه الآليات الإحصائية يمكنها أن تُسهم في تحسُن حالات المرضَى.

على مدى السنوات الماضية، طور العلماء تقنيات تعلم الآلة لتحسين أداء ’نماذج تحليل البقاء‘، غير أن توفير توقعات دقيقة يظل تحدياً كبيراً مطروحاً بسبب التعقيدات المرتبطة بالبيانات التي تعتمد عليها ’نماذج تحليل البقاء‘ لإنتاج هذه التوقعات.

واحدة من التحديات التي يجب على نماذج تعلم الآلة رفعها هو أن تكون قادرة على معالجة البيانات متعددة الوسائط – مثل السجلات الطبية الإلكترونية، وصور الأورام، والتقارير المخبرية – وفهم هذه الأنواع المختلفة من المعلومات على نحو متكامل وشامل. كما تواجه نماذج تعلم الآلة، فضلا عن هذا، عقبة أخرى تتجلى في افتقار سجلات المرضى غالباً للبيانات المهمة، المعروفة باسم البيانات الخاضعة للرقابة، مما يجعل تدريبها أكثر صعوبة.

لرفع هذا التحدي، طور مؤخراً فريق بحثي من جامعة محمد بن زايد للذكاء الاصطناعي، تحت إشراف د. نعمان سعيد، زميل ما بعد الدكتوراه في مجال الرؤية الحاسوبية، طريقة جديدة يمكن دمجها في ’نماذج تحليل البقاء‘. وتعتمد مقاربتهم على استخدام البيانات متعددة الوسائط مع مراعاة البيانات الخاضعة للرقابة [المعلومات غير المتوفرة]. ويطلق سعيد وفريقه البحثي على ابتكارهم اسم survival rank-n-contrast (SurvRNC)، وهو مصمم لتوقع مدة البقاء على قيد الحياة لمرضى سرطان الرأس والرقبة بناءً على السجلات الطبية.

يذكر أن سعيد قدم مؤخراً عمله مع فريقه البحثي خلال فعاليات المؤتمر الدولي السابع والعشرين للحوسبة الطبية للصور والتدخل المدعوم بالحاسوب (MICCAI) الذي انعقد في مدينة مراكش بالمغرب.

فهم الحلقات المفقودة

المفترض، في أحسن الأحوال، أن تكون سجلات المرضى كاملة وتحتوي على جميع المعلومات، غير أن المفترض ليس هو الواقع، حيث تكون – في بعض الحالات – سجلات المرضى مستوفاة بجميع التفاصيل الطبية بما في ذلك: نتائج التحاليل المخبرية وتواريخ التشخيص والعلاج، وربما حتى وقت الوفاة؛ وفي حالات أخرى، قد تكون السجلات محدودة وتتضمن فقط التاريخ الذي تم فيه تشخيص المريض ويوم زيارته الأخيرة للطبيب – وعن هذه المشكلة يقول سعيد:

“قد نعلم أن المريض كان على قيد الحياة بعد 100 يوم من التشخيص، لكننا لا نتوفر على أية معلومات مسجلة عمَّا حدث له بعد ذلك “.

ويتابع سعيد شارحاً أن البيانات الواردة في هذه السجلات غير المكتملة لها قيمتها ولو لم تكن شاملة، ويجب معالجتها بشكل مختلف عن البيانات المثبتة في السجلات الكاملة، وبناء عليه يضيف موضحاً: “إننا بحاجة إلى برمجة النموذج على نحو معين ونخبره أننا لا نعلم وقت وفاة المرضى ذوي السجلات المقيدة [غير المكتملة]، ولكننا نعلم أنهم كانوا على قيد الحياة إلى حدود وقت معين”.

وفقاً لهذا النهج، يُعطي نموذج SurvRNC المرضى ذوي السجلات الطبية الكاملة – المرضى المؤكدين – وزناً أكبر، بينما يعطي النموذج نفسه المرضى ذوي السجلات الطبية غير الكاملة – المرضى غير المؤكدين – وزناً أقل، و(يشير الوزن هنا إلى الأهمية التي يعطيها النموذج للبيانات) – ويوضح سعيد هذا النهج قائلاً: “عندما يتعلق الأمر بتشخيص تطور حالة مرضية ما، يطرح المرضى ذووا السجلات الطبية المقيدة [غير المكتملة] دائماً تحدياً، وتختلف الطرق التي تمنح بها لبياناتهم أهمية [وزن] أكبر أو أقل”.

تعقيدات توقع مدة البقاء على قيد الحياة

اعتمد سعيد وزملاؤه في بحثهم استخدام مجموعة بيانات HECKTOR الضخمة لتدريب نموذجهم، والتي تتضمن معلومات عمّا يقرب من 500 مريض مصاب بسرطان الرأس والرقبة الذي يعد واحداً من أخطر الأنواع وأكثرها فتكاً. وتتضمن مجموعة البيانات صوراً طبية، مثل: فحوصات التصوير المقطعي المحوسب، والتصوير المقطعي بالإصدار البوزيتروني، والسجلات الصحية الإلكترونية والمعلومات المتعلقة بوقت التشخيص ووقت العلاج.

كما يجب ملاحظة أن حوالي 70% من السجلات الطبية ضمن مجموعة بيانات HECKTOR لا تتوفر على معلومات قطعية حول المدة التي عاشها المرضى بعد التشخيص. ورغم عدم توفر هذه البيانات، وهي مشكلة شائعة في مجموعات البيانات الطبية، أوضح سعيد أن “قاعدة بيانات HECKTOR هي جيدة جداً لتدريب نموذجهم بسبب تنوع المستشفيات التي تم جمع البيانات منها وتنوع المعدات المستخدمة”.

نموذج SurvRNC

لطالما استخدمت نماذج تعلم الآلة في ما يُعرف بعمليات التصنيف، والتي يمكن الاستفادة منها في المجال الطبي لتصنيف المرضى إلى مجموعات بناءً على مدى خطر إصابتهم بمرض ما، غير أن توقع مدة البقاء على قيد الحياة تطرح مشكلة مختلفة، تسمى بعملية تحليل الانحدار التي ينتج عنها ما يُعرف بالتمثيلات المنظمة، وهي قيم على طول سلسلة متصلة تتخذ شكل قيم زمنية في حالة نموذج SurvRNC.

ويشار، في هذا الصدد، إلى أن عمليات تحليل الانحدار تكون أصعب في الحل بشكل عام مقارنة مع عمليات التصنيف لأنها تتطلب تفسيراً أكثر دقة للبيانات، حيث يمكن أن يكون للاختلافات الدقيقة بين السجلات – على سبيل المثال، اختلافات بسيطة في مكان أو حجم الورم – تأثير كبير على نتائج التوقعات، ويجب أن يأخذ النموذج هذه الاختلافات في الاعتبار لإجراء توقع دقيق.

وتعتمد طريقة سعيد وزملائه على معالجة السجلات الصحية متعددة الوسائط، وإنشاء تمثيلات لها كمتجهات تضمين معبرٌ عنها بيانياً في مساحة تضمين ثلاثية الأبعاد. وتتضمن بعض هذه السجلات مدة البقاء على قيد الحياة، وبعضها الآخر لا يتوفر على هذه المعلومة، الأمر الذي يأخذه نموذج SurvRNC في عين الاعتبار، وبناءً عليه يتعامل مع كل نوع من هذه السجلات الطبية بشكل مختلف – كما يلي:

  • “الأزواج المؤكدة”: تشمل هذه الفئة السجلات الصحية التي تتوفر فيها بيانات عن مدة البقاء على قيد الحياة، وتكون مدة بقاء أصحابها على قيد الحياة متشابهة، حيث يتم جمعها بالقرب من بعضها داخل مساحة التضمين؛
  • “الأزواج السلبية”: تشمل هذه الفئة السجلات الصحية التي لا يُظهر أصحابها تشابُهاً فيما يخص مدة بقائهم على قيد الحياة، والتي يقوم النموذج بتمثيلِها في مكان بعيد داخل مساحة التضمين؛
  • “الأزواج غير المؤكدة”: تشمل هذه الفئة السجلات الصحية التي لا تتوفر فيها بيانات عن مدة بقاء أصحابها على قيد الحياة، حيث يتم جمع أصحابها في أزواج داخل مساحة التضمين كما لا يعطيها النموذج أهمية [وزن] كبير.

وقد تبين للفريق البحثي الذي يقوده سعيد بعد قيامه بمقارنة أداء نموذج SurvRNC بنماذج تعلم الآلة أخرى متطورة خاصة بتحليل البيانات المرتبطة بتوقعات مدة البقاء على قيد الحياة باستخدام مجموعة بيانات HECKTOR أن نموذج SurvRNC سجل تحسناً بنسبة 3.6% مقارنة مع نماذج من الفئة نفسها.

الخطوات التالية

يسعى سعيد إلى مواصلة تحسين نموذجSurvRNC ، ويأمل في أن يطلقه في نسخته التجريبية في أحد المراكز الطبية، والتي يقول إنها قادرة أيضاً على وقع مدة البقاء على قيد الحياة بالنسبة للأشخاص المصابين بأنواع أخرى من السرطانات مثل سرطان القولون والثدي.

واختتم سعيد كلامه قائلا: “يمكن أن تكون تقنيات الذكاء الاصطناعي الجديدة مفيدة للغاية، وخاصة في المناطق النائية حول العالم وفي البلدان التي تفتقر إلى المعدات الباهظة الثمن المستخدمة لعلاج السرطان في البلدان الأكثر تقدماً. كما أننا نأمل، من خلال هذا العمل، أن نتمكن من تقليل العبء على الأطباء حتى يتمكنوا من تحديد العلاجات المثلى لمرضاهم بشكل أسرع وأفضل”.

أخبار ذات صلة

thumbnail
Tuesday, November 26, 2024

النماذج اللغوية الكبيرة وفهم انفعالات الإنسان وعواطفه

فريق بحثي من جامعة محمد بن زايد للذكاء الاصطناعي وجامعة موناش يبحث في مدى قدرة النماذج اللغوية.....

  1. البحوث ,
  2. النماذج اللغوية الكبيرة ,
  3. EMNLP ,
  4. معالجة اللغة الطبيعية ,
  5. انفعالات الإنسان ,
  6. التعاطف ,
اقرأ المزيد