رغم التقدم المُحرز في علاجه، يظل السرطان من أكثر الأمراض فتكاً، حيث تُسجَّل – وفقاً لإحصائيات منظمة الصحة العالمية – أكثر من 10 ملايين حالة وفاة بسببه في جميع أنحاء المعمورة، وهذا العدد – للأسف – مرشح للارتفاع. وتتوقع المنظمة نفسها بحلول عام 2040 أن يصل عدد حالات الوفيات إلى 30 مليون شخص سنوياً بسبب الإصابة بالسرطان.
الملاحظ، عندما يُشخص مريض بالسرطان، أن الأطباء يلجؤون إلى استخدام آليات إحصائية تعرف بـ ’نماذج تحليل البقاء‘ لمساعدتهم في توقع مسار تطور الحالة. وتؤثر – بالطبع – هذه التوقعات التي تتيحها هذه الآليات في الكيفية التي يتخذ بها الأطباء القرارات العلاجية. كما أن دقة التوقعات التي تنتجها هذه الآليات الإحصائية يمكنها أن تُسهم في تحسُن حالات المرضَى.
على مدى السنوات الماضية، طور العلماء تقنيات تعلم الآلة لتحسين أداء ’نماذج تحليل البقاء‘، غير أن توفير توقعات دقيقة يظل تحدياً كبيراً مطروحاً بسبب التعقيدات المرتبطة بالبيانات التي تعتمد عليها ’نماذج تحليل البقاء‘ لإنتاج هذه التوقعات.
واحدة من التحديات التي يجب على نماذج تعلم الآلة رفعها هو أن تكون قادرة على معالجة البيانات متعددة الوسائط – مثل السجلات الطبية الإلكترونية، وصور الأورام، والتقارير المخبرية – وفهم هذه الأنواع المختلفة من المعلومات على نحو متكامل وشامل. كما تواجه نماذج تعلم الآلة، فضلا عن هذا، عقبة أخرى تتجلى في افتقار سجلات المرضى غالباً للبيانات المهمة، المعروفة باسم البيانات الخاضعة للرقابة، مما يجعل تدريبها أكثر صعوبة.
لرفع هذا التحدي، طور مؤخراً فريق بحثي من جامعة محمد بن زايد للذكاء الاصطناعي، تحت إشراف د. نعمان سعيد، زميل ما بعد الدكتوراه في مجال الرؤية الحاسوبية، طريقة جديدة يمكن دمجها في ’نماذج تحليل البقاء‘. وتعتمد مقاربتهم على استخدام البيانات متعددة الوسائط مع مراعاة البيانات الخاضعة للرقابة [المعلومات غير المتوفرة]. ويطلق سعيد وفريقه البحثي على ابتكارهم اسم survival rank-n-contrast (SurvRNC)، وهو مصمم لتوقع مدة البقاء على قيد الحياة لمرضى سرطان الرأس والرقبة بناءً على السجلات الطبية.
يذكر أن سعيد قدم مؤخراً عمله مع فريقه البحثي خلال فعاليات المؤتمر الدولي السابع والعشرين للحوسبة الطبية للصور والتدخل المدعوم بالحاسوب (MICCAI) الذي انعقد في مدينة مراكش بالمغرب.
المفترض، في أحسن الأحوال، أن تكون سجلات المرضى كاملة وتحتوي على جميع المعلومات، غير أن المفترض ليس هو الواقع، حيث تكون – في بعض الحالات – سجلات المرضى مستوفاة بجميع التفاصيل الطبية بما في ذلك: نتائج التحاليل المخبرية وتواريخ التشخيص والعلاج، وربما حتى وقت الوفاة؛ وفي حالات أخرى، قد تكون السجلات محدودة وتتضمن فقط التاريخ الذي تم فيه تشخيص المريض ويوم زيارته الأخيرة للطبيب – وعن هذه المشكلة يقول سعيد:
“قد نعلم أن المريض كان على قيد الحياة بعد 100 يوم من التشخيص، لكننا لا نتوفر على أية معلومات مسجلة عمَّا حدث له بعد ذلك “.
ويتابع سعيد شارحاً أن البيانات الواردة في هذه السجلات غير المكتملة لها قيمتها ولو لم تكن شاملة، ويجب معالجتها بشكل مختلف عن البيانات المثبتة في السجلات الكاملة، وبناء عليه يضيف موضحاً: “إننا بحاجة إلى برمجة النموذج على نحو معين ونخبره أننا لا نعلم وقت وفاة المرضى ذوي السجلات المقيدة [غير المكتملة]، ولكننا نعلم أنهم كانوا على قيد الحياة إلى حدود وقت معين”.
وفقاً لهذا النهج، يُعطي نموذج SurvRNC المرضى ذوي السجلات الطبية الكاملة – المرضى المؤكدين – وزناً أكبر، بينما يعطي النموذج نفسه المرضى ذوي السجلات الطبية غير الكاملة – المرضى غير المؤكدين – وزناً أقل، و(يشير الوزن هنا إلى الأهمية التي يعطيها النموذج للبيانات) – ويوضح سعيد هذا النهج قائلاً: “عندما يتعلق الأمر بتشخيص تطور حالة مرضية ما، يطرح المرضى ذووا السجلات الطبية المقيدة [غير المكتملة] دائماً تحدياً، وتختلف الطرق التي تمنح بها لبياناتهم أهمية [وزن] أكبر أو أقل”.
تعقيدات توقع مدة البقاء على قيد الحياة
اعتمد سعيد وزملاؤه في بحثهم استخدام مجموعة بيانات HECKTOR الضخمة لتدريب نموذجهم، والتي تتضمن معلومات عمّا يقرب من 500 مريض مصاب بسرطان الرأس والرقبة الذي يعد واحداً من أخطر الأنواع وأكثرها فتكاً. وتتضمن مجموعة البيانات صوراً طبية، مثل: فحوصات التصوير المقطعي المحوسب، والتصوير المقطعي بالإصدار البوزيتروني، والسجلات الصحية الإلكترونية والمعلومات المتعلقة بوقت التشخيص ووقت العلاج.
كما يجب ملاحظة أن حوالي 70% من السجلات الطبية ضمن مجموعة بيانات HECKTOR لا تتوفر على معلومات قطعية حول المدة التي عاشها المرضى بعد التشخيص. ورغم عدم توفر هذه البيانات، وهي مشكلة شائعة في مجموعات البيانات الطبية، أوضح سعيد أن “قاعدة بيانات HECKTOR هي جيدة جداً لتدريب نموذجهم بسبب تنوع المستشفيات التي تم جمع البيانات منها وتنوع المعدات المستخدمة”.
لطالما استخدمت نماذج تعلم الآلة في ما يُعرف بعمليات التصنيف، والتي يمكن الاستفادة منها في المجال الطبي لتصنيف المرضى إلى مجموعات بناءً على مدى خطر إصابتهم بمرض ما، غير أن توقع مدة البقاء على قيد الحياة تطرح مشكلة مختلفة، تسمى بعملية تحليل الانحدار التي ينتج عنها ما يُعرف بالتمثيلات المنظمة، وهي قيم على طول سلسلة متصلة تتخذ شكل قيم زمنية في حالة نموذج SurvRNC.
ويشار، في هذا الصدد، إلى أن عمليات تحليل الانحدار تكون أصعب في الحل بشكل عام مقارنة مع عمليات التصنيف لأنها تتطلب تفسيراً أكثر دقة للبيانات، حيث يمكن أن يكون للاختلافات الدقيقة بين السجلات – على سبيل المثال، اختلافات بسيطة في مكان أو حجم الورم – تأثير كبير على نتائج التوقعات، ويجب أن يأخذ النموذج هذه الاختلافات في الاعتبار لإجراء توقع دقيق.
وتعتمد طريقة سعيد وزملائه على معالجة السجلات الصحية متعددة الوسائط، وإنشاء تمثيلات لها كمتجهات تضمين معبرٌ عنها بيانياً في مساحة تضمين ثلاثية الأبعاد. وتتضمن بعض هذه السجلات مدة البقاء على قيد الحياة، وبعضها الآخر لا يتوفر على هذه المعلومة، الأمر الذي يأخذه نموذج SurvRNC في عين الاعتبار، وبناءً عليه يتعامل مع كل نوع من هذه السجلات الطبية بشكل مختلف – كما يلي:
وقد تبين للفريق البحثي الذي يقوده سعيد بعد قيامه بمقارنة أداء نموذج SurvRNC بنماذج تعلم الآلة أخرى متطورة خاصة بتحليل البيانات المرتبطة بتوقعات مدة البقاء على قيد الحياة باستخدام مجموعة بيانات HECKTOR أن نموذج SurvRNC سجل تحسناً بنسبة 3.6% مقارنة مع نماذج من الفئة نفسها.
يسعى سعيد إلى مواصلة تحسين نموذجSurvRNC ، ويأمل في أن يطلقه في نسخته التجريبية في أحد المراكز الطبية، والتي يقول إنها قادرة أيضاً على وقع مدة البقاء على قيد الحياة بالنسبة للأشخاص المصابين بأنواع أخرى من السرطانات مثل سرطان القولون والثدي.
واختتم سعيد كلامه قائلا: “يمكن أن تكون تقنيات الذكاء الاصطناعي الجديدة مفيدة للغاية، وخاصة في المناطق النائية حول العالم وفي البلدان التي تفتقر إلى المعدات الباهظة الثمن المستخدمة لعلاج السرطان في البلدان الأكثر تقدماً. كما أننا نأمل، من خلال هذا العمل، أن نتمكن من تقليل العبء على الأطباء حتى يتمكنوا من تحديد العلاجات المثلى لمرضاهم بشكل أسرع وأفضل”.
يحتفي العالم في 18 ديسمبر من كل عام باليوم العالمي للغة الضاد في لفتَتٍ يقف فيها العالم.....
فريق بحثي من جامعة محمد بن زايد للذكاء الاصطناعي وجامعة موناش يبحث في مدى قدرة النماذج اللغوية.....
اقرأ المزيدفريق بحثي من جامعة محمد بن زايد للذكاء الاصطناعي يفوز بجائزة تقديرية عن دراسة بحثية تشجع الباحثين.....