مرحلة جديدة للذكاء الاصطناعي: من رصد الفروقات إلى فهم التغيّرات في صور الرنين المغناطيسي - MBZUAI MBZUAI

مرحلة جديدة للذكاء الاصطناعي: من رصد الفروقات إلى فهم التغيّرات في صور الرنين المغناطيسي

الأربعاء، 22 أكتوبر 2025

يطرح علم الأشعة سؤالاً يبدو بسيطاً للوهلة الأولى، لكنه في الحقيقة معقّد ويُعاد طرحه مراراً: ما الذي تغيّر بين صورة الرنين المغناطيسي للعام الماضي وصورة اليوم؟

بالنسبة للأشخاص المصابين بالتصلّب المتعدد (MS)، قد تُحدّد الإجابة عن هذا السؤال خيارات العلاج، إذ إن ظهور بُقعة ساطعة جديدة في فحص المتابعة بتقنية FLAIR  يُعدّ دليلاً على نشاط مرضي حديث إلا أن اكتشاف هذه البقع الدقيقة باستخدام الأساليب التقليدية مهمة شديدة الصعوبة.

أخصائي الأشعة مطالب بأن يقوم ذهنياً بمحاذاة مسحين ثلاثيي الأبعاد، وأن يأخذ في الاعتبار اختلاف أجهزة التصوير وإعداداتها، ثم يقرّر ما إذا كانت لطخة خافتة تمثل تغيراً بيولوجياً حقيقياً أو مجرد تشويش في الصورة. إنها عملية بطيئة ومرهقة، وتظهر فيها فروق ملحوظة حتى بين الخبراء.

وهنا يأتي دور النظام الجديد DEFUSE-MS، الذي يحاول تقليل الجهد والشك الملازمَين لهذه العملية من خلال إعادة صياغة المهمة بالكامل:

بدلاً من محاولة تحديد ما “يبدو” مختلفاً فحسب، يركز النظام على فهم كيفية تغيّر الدماغ فعلياً بمرور الزمن، لا مجرد مقارنة الصور بصرياً.

في ورقة بحثية قُدِّمت في مؤتمر  المؤتمر الدولي لعلوم التصوير الطبي والحوسبة المساعدة للتدخلات الجراحية 2025، يصف باحثون من جامعة محمد بن زايد للذكاء الاصطناعي وشركاؤهم في المجال الطبي نظام DEFUSE-MS بأنه «إطار عمل قائم على رسم بياني زماني–مكاني موجَّه بخريطة التشوّه»، وبدلاً من التعامل مع كل فحص على أنه مجرد مجموعة من وحدات البكسل، يبني النموذج رسماً بيانياً لمناطق صغيرة (عُقَد) داخل صور الرنين المغناطيسي الأساسية وصور المتابعة، ثم يربط تلك المناطق بشكلٍ صريح عبر الزمن بواسطة حواف تحمل وصفاً مضغوطاً لكيفية تحرّك البنية التشريحية بين الزيارات.  

يأتي هذا الوصف من خطوة في البرنامج تستخدم طريقة قديمة تُدعى “ديمونز”. هذه الخطوة تقوم بإنشاء ما يسمى “خريطة التشوه”، وهي عبارة عن خريطة ثلاثية الأبعاد تحتوي على أسهم صغيرة. وظيفة هذه الأسهم هي أن تُظهر بدقة كيف يجب أن تتحرك أو تتغير كل نقطة في الصورة الأولى (الصورة الأصلية) حتى تتطابق تماماً مع الصورة الثانية (الصورة الجديدة). وهذه الطريقة مفيدة جداً في أمراض مثل التصلب المتعدد، حيث إن الآفات الجديدة الحقيقية تدفع الأنسجة المحيطة بها إلى التغير بطرق مميزة ومحددة. فيقوم البرنامج بالتقاط هذا النمط الخاص من التغيرات عبر “خريطة التشوه”، وهذا يحوّل عملية البحث عن الفروقات بين الصورتين إلى دليل منظم وواضح، يمكن لنماذج الذكاء الاصطناعي استخدامه بفعالية للاستنتاج والعثور على التغيرات الحاصلة.

تجمع هذه البنية بين تصميم مألوف على شكل حرفU (المشفّر وفكّ المشفّر)، وهو الأساس في العديد من أنظمة تجزئة الصور الطبية، وبين وحدة بيانية زمانية–مكانية غير متجانسة (HSTGM) مدمجة داخل كلٍّ من المشفّر وفكّ المشفّر.  انطلاقًا من الطبقات الالتفافية الأولى (المعروفة بجذع الشبكة)، يقوم نظام DEFUSE-MS بإنشاء مجموعتين من العقد: مجموعة خاصة بصورة الأساس وأخرى بصورة المتابعة. ثم يربط كل عقدة بأقرب جيرانها المكانيين داخل الصورة نفسها، ويربط أيضًا عقدة الأساس بنظيرتها المقابلة في صورة المتابعة عبر حواف زمنية.

تكمن الفكرة في إثراء الحواف الزمنية بتضمينات متعلّمة من حقل التشوّه، مما يمكّن وحدة HSTGM  من وزن الرسائل وفقًا للإجابة عن السؤال: «إلى أي مدى، وبأي طريقة، تشوّهت هذه المنطقة؟». وقد تبيّن أن التعامل مع التشوّه كخاصية للحافة، وليس كقناة بصرية إضافية، أمر بالغ الأهمية، خصوصًا في النماذج المعتمدة على آليات الانتباه التي قد ترتبك عند إدخال الإشارات الهندسية في فضاء المظهر.

داخل وحدة HSTGM، يستخدم الفريق نوعًا من الشبكات العصبية البيانية يُعرف باسم Max-Relative GNN، حيث تنظر كل عقدة إلى الفروقات النسبية بينها وبين جيرانها، وتحتفظ بأقوى إشارة. إنها آلية بسيطة لكنها فعّالة للغاية في إبراز أكثر التغيّرات المحلية دلالة. بعد إجراء تحديثات منفصلة على الرسوم البيانية الخاصة بصور الأساس وصور المتابعة، تقوم شبكة بيانية زمنية (Temporal GNN) بدمج المعلومات عبر الزمن باستخدام تلك الحواف المدركة للتشوّه. وتعمل الطبقات الأمامية (Feed-Forward) على تعزيز قدرة النموذج التعبيرية ومنع ظاهرة التنعيم المفرط.

يبقى النظام بأكمله قابلاً للتدريب من البداية إلى النهاية (end-to-end differentiable)، بحيث يتم تعلم تضمينات التشوّه الموجودة على الحواف بشكل مشترك مع هدف التجزئة، بدلاً من تصميمها يدوياً. والنتيجة هي نموذج هجين مُتقن يجمع بين: الشبكات العصبية الالتفافية (CNNs) التي توفر التفاصيل المحلية والكفاءة، وطبقات الرسم البياني التي تضيف بنية زمانية–مكانية بعيدة المدى، وحقل التشوّه الذي يرسّخ مفهوم “التغيّر” في الهندسة البنيوية لا في شدة الصورة فقط.

يقول مصطفى سالم، أحد مؤلفي الورقة البحثية، إن الدافع وراء العمل كان واضحاً وبسيطاً: اكتشاف الآفات الجديدة هو بطبيعته مهمة طولية عبر الزمن. ويضيف موضحاً: “نماذج المسح الواحد تسأل: هل يبدو هذا الفوكسل كآفة؟ أما مهمتنا نحن فتسأل: ما الذي تغيّر فعلياً بين صورة الأساس والمتابعة؟” لذلك، تحتاج إلى تمثيل قادر على فصل التغير البيولوجي الحقيقي عن الاختلافات الناتجة عن الجهاز أو إعداداته. ويحقق حقل التشوّه هذا الهدف بدقة. فإذا انتفخت منطقة ما أو تحركت المناطق المحيطة بها، يسجّل الحقل ذلك. أما إذا كانت البقعة الساطعة مجرد ارتفاع عابر في الشدة، فإن البنية الهندسية تبقى ثابتة. يتعامل النموذج مع حقل التشوّه باعتباره معلومة تتدفق بين النقاط الزمنية عبر الحواف، وهو المكان الطبيعي لتمثيل هذا النوع من العلاقات.

المقارنة المعيارية والمستقبل السريري

لا يكتسب كل ما سبق أهميته إلا إذا أثبت النظام قدرته على الصمود أمام اختبار واقعي. وهنا يعتمد نظام DEFUSE-MS  على مجموعة البيانات MSSEG-II، وهي مجموعة طولية لمرضى التصلب المتعدد تمتد عبر 100  مريض و15 جهاز تصوير. وقد قام المنظّمون مؤخراً بتحديث مجموعة الاختبار، عبر تصحيح العلامات وإضافة آفات جديدة—وهي خطوة ليست مبهرة لكنها بالغة الأهمية، لأنها تجعل المهمة أصعب والتقييم أكثر عدلاً. تم تدريب DEFUSE-MS على صور FLAIR  ثلاثية الأبعاد بطريقة تعتمد على تقسيم الصورة إلى رقع (patch-wise) ، مع تطبيق معالجة مسبقة دقيقة.

أما أثناء الاستدلال، يعتمد النظام على تحليل البيانات في أجزاء متتالية (بأسلوب النافذة المنزلقة)، متبوعة بإعادة تجميع النتائج، بينما يتم تدريب خط الأنابيب بأكمله على وحدة معالجة رسومات A100 واحدة، ويعمل بسرعة متوافقة مع سير العمل السريري.

على مجموعة الاختبار MSSEG-II ، يتفوّق DEFUSE-MS على أحدث نماذج الأساس المعتمدة على الشبكات العصبونية الالتفافية (CNN) والمحولات (Transformers)، وفي الحالات التي لا تظهر فيها آفات جديدة، يبلغ متوسط حجم الآفات الإيجابية الكاذبة نحو 1.5 مم³ عند استخدام كلٍّ من تضمينات التشوّه وسمات الحواف المكانية. قد يبدو هذا الرقم ضئيلاً، لكنه ذو أهمية سريرية واضحة، خاصة عند محاولة تقليل الإنذارات الكاذبة قدر الإمكان. كما يشير الفريق إلى أن النظام يحقق نسبة أقل من الإيجابيات الكاذبة ( إظهار نتيجة إيجابية بينما تكون النتيجة في الواقع سلبية) مقارنة بالعديد من النماذج التي لا تستخدم حقول التشوّه—وهو مكسب عملي مهم في العيادات، حيث تكون المتابعات “النظيفة” (الخالية من الآفات الجديدة) شائعة جداً.

قد يبدو خيار عدم إضافة «حقل التشوّه» كقناة إضافية في مدخلات الصورة أمراً مفاجئاً، خاصةً للمتخصصين في التعلم العميق. لكن في النماذج المعتمدة على آليات الانتباه، تأتي هذه الاستراتيجية بنتائج عكسية؛ لأن حقل التشوّه ليس جزءاً من المظهر، وإجباره على الدخول في مصفوفة الصورة يضيف تشويشات غير متسقة تربك خرائط الانتباه. أما عند التعامل معه كخاصية للحافة، فإن الإشارة نفسها تصبح مفيدة بدلًا من أن تكون ضارة. ورغم ذلك، يتفوّق نموذج DEFUSE-MS على نموذج U-Net القوي الذي يدمج حقل التشوّه مع الصور، حتى وإن كان الأخير يُنتج أحياناً عدداً أقل من الإيجابيات الكاذبة الصغيرة؛ إذ تبقى مؤشرات الكشف الإجمالية أفضل مع النهج القائم على الرسم البياني. وتشير هذه النتيجة إلى درس أشمل:  يجب أن تكون المراسلات الهندسية ضمن الأجزاء التي تمثل العلاقات داخل النموذج، وليس في طبقات البكسلات نفسها.

استشراف المستقبل

لا يمكن لنظام واحد أن يحسم النقاش بالكامل. وكان سالم صريحاً بشأن القيود الحالية والمسارات المستقبلية. إحدى أكبر الخطوات هي تجاوز المقارنة بين نقطتين زمنيتين فقط، فالرعاية الحقيقية لمرض التصلب المتعدد هي رحلة تمتد لسنوات وهو ما يتطلب بناء سلسلة مترابطة من الرسوم البيانية التي تربط كل زيارة للمريض بالتي تليها، مع إدراك كامل للتغيرات الشكلية، مما يسمح بتراكم الأدلة عبر الزمن.

وهناك مسار آخر لزيادة الدقة، وهو دمج أنواع متعددة من صور الرنين المغناطيسي، مثل تسلسلات  (T1)أو تسلسلات الرنين المحسّنة بمادة الجادولينيوم للمساعدة في تمييز الإيجابيات الكاذبة وتوصيف النشاط المرضي بدقة أعلى. كما يدرس الفريق تطبيق أساليب مثل “التعلم الموحّد”، لتمكين المستشفيات من تكييف النموذج محلياً، وهو أمر ضروري نظراً للاختلافات بين أجهزة التصوير والبروتوكولات المتبعة. وعلى الرغم من أن هذا النهج صمم خصيصاً للتصلب المتعدد، إلا أن فكرته الجوهرية يمكن تعميمها بسهولة على أي حالة طبية أخرى يتطور فيها التشريح بمرور الوقت، كالأورام أو التغيرات التي تلي الجراحة.

من المفيد التوقف قليلاً والتساؤل: ما الذي يُعتبر أداءً جيداً حقاً في هذا المجال؟ فحتى أفضل أخصائيي الأشعة البشريين لا يتفقون اتفاقاً كاملاً على تصنيف الآفات الجديدة؛ ومجموعة الاختبار المحدثة (MSSEG-II) نفسها تُظهر مدى صعوبة توحيد عملية التقييم عبر أجهزة التصوير والمراكز المختلفة. تقع نتائج نظام DEFUSE-MS تحت أعلى نتيجة لخبير بشري واحد، لكنها تتفوق بشكل واضح على الأنظمة الآلية السابقة التي تم اختبارها على بيانات أقدم (والتي كانت بطبيعتها أسهل). والأهم من ذلك، أن DEFUSE-MS يحقق هذه المكاسب بينما يتعامل مع الحقيقة الأرضية (Ground Truth) المنقّحة والمُحدّثة، مما يجعل إنجازه أكثر واقعية وموثوقية. كما تعرض الورقة أمثلة نوعية تُظهر قدرة النموذج المدرك للتشوّه على رصد آفات دقيقة جداً تتجاهلها النماذج الأخرى. وفي حالة واحدة على الأقل، تطابق حكم النموذج مع إجماع عدة أخصائيين بشريين. هذا الأسلوب من التثليث أو التكامل – حيث يقوم النظام الآلي بتحديد حالة محتملة، ثم يقوم الخبراء بمراجعتها وتأكيدها – يبدو أنه التوزيع الأنسب للمهام بين الإنسان والآلة على المدى القريب.

يكمن الدرس المستفاد الأهم هنا في البُعد المفاهيمي، فقد كان تركيز الذكاء الاصطناعي في التصوير الطبي لسنوات منصبّاً على تطوير مصنّفات بكسلات أفضل: شبكات U-Net أعمق، ومحولات أكبر. لكن DEFUSE-MS  يشير إلى محور مختلف للتحسين: بناء نماذج تُشفّـر بنية المهمة نفسها. فالمهام الطولية لا تتعلق بمظهر الصورة في لحظة واحدة، بل بالعلاقات الممتدة عبر الزمن. ولذلك، ينبغي تزويد النموذج بـ مفردات تمكّنه من فهم هذه العلاقات، وتغذيته بأدلة هندسية تساعده على التمييز بين التغير الحقيقي والتحف الفنية. وبمجرّد أن ترى حقل التشوّه كـ “حافة” في الرسم البياني بدلاً من اعتباره “قناة” في الصورة، تبدأ الكثير من قرارات التصميم المعماري في اتخاذ معنى أوضح.

إذا وصلت أنظمة مثل هذه إلى مسارات العمل السريرية، فهي لن تحلّ محل حكم أخصائي الأشعة، بل ستجعله أسرع وأكثر اتساقاً وأقل عرضة للخطأ، خصوصاً في الحالات الصعبة التي تتطلب مقارنة دقيقة بين الصور؛ مثل تلك التي تكون فيها الآفة الجديدة بعرض ملليمتر واحد فقط، والصورة المتابعة ملتقطة بجهاز مختلف.

أخبار ذات صلة

thumbnail
الجمعة، 07 نوفمبر 2025

جامعة محمد بن زايد للذكاء الاصطناعي و «GenBio AI» تفوزان بجائزة الإمارات للذكاء الاصطناعي 2025

تم تقديم الجائزة إلى البروفيسور لي سونغ، الشريك المؤسس والرئيس التنفيذي للتكنولوجيا في GenBio AI وأستاذ تعلم.....

  1. research ,
  2. innovation ,
  3. large language models ,
  4. llm ,
  5. award ,
  6. biology ,
  7. foundation models ,
  8. genbio ,
اقرأ المزيد