الصفحة الرئيسية / الأخبار / كيف يمكن للتعلم المعزز أن يساعد أنظمة الذكاء الاصطناعي الطبي على التفكير مثل الطبيب

كيف يمكن للتعلم المعزز أن يساعد أنظمة الذكاء الاصطناعي الطبي على التفكير مثل الطبيب

الثلاثاء، 07 أبريل 2026

عندما يجري الطبيب تشخيصاً، نادراً ما يعتمد على قرار واحد فقط، بل يقوم بدمج أنواع متعددة من المعلومات، مثل التاريخ الطبي للمريض ونتائج الفحوصات المخبرية والصور الطبية، مستفيداً من خبرته وتدريبه. ورغم أننا لا نفهم بشكل كامل العمليات الذهنية المعقدة التي يمر بها الأطباء أثناء التفكير في التشخيص، إلا أنه لا شك في أن ذلك يتطلب قدرةً كبيرة على التكيف مع السياق والتعامل مع الغموض.

يعتبر هذا من الأمور التي تجعل تعليم الاستدلال الطبي للآلات أمراً صعباً، فمعظم أنظمة الذكاء الاصطناعي الطبي الحالية هي في جوهرها أدوات تصنيف تؤدي بشكل جيد ضمن مهام محددة، مثل تحديد الأورام السرطانية في صور الأشعة إلا أنها تعجز عن محاكاة القدرة الشمولية للطبيب على تفسير بيانات متعددة الأنماط واتخاذ قرار تشخيصي عندما لا تكون الأدلة واضحة بشكل قاطع.

يقدم التعلم مساراً واعداً للمضي قدماً، فبدلاً من تدريب النموذج على بيانات معنونة، يُتيح التعلم المعزز للنموذج القدرة على التعلم أثناء توليد الاستجابات وتلقي تغذية راجعة عليها. ومع ذلك، فإن للتعلم المعزز قيداً مهماً، إذ يتطلب إشارة مكافأة واضحة. لا يمثل هذا مشكلة في مسائل الرياضيات أو الأسئلة متعددة الخيارات التي لها إجابة صحيحة واحدة، لكن الأسئلة الطبية قد يكون لها عدة إجابات صحيحة، وقد تُصاغ بطرق مختلفة تبعاً للسياق، وقد حدّ هذا التباين من تأثير التعلم المعزز في الذكاء الاصطناعي الطبي.

قدم باحثون من جامعة محمد بن زايد للذكاء الاصطناعي، بالتعاون مع أطباء من مؤسسات أخرى، إطاراً جديداً للتعلم المعزز يحمل اسم MediX-R1، يمكن استخدامه لضبط النماذج اللغوية متعددة الوسائط وتحسين أدائها في الإجابة عن الأسئلة الطبية المفتوحة، ويعالج هذا الإطار الجديد أحد القيود الأساسية في أطر التعلم المعزز التقليدية من خلال استخدام دالة مكافأة متقدمة قادرة على تقييم الاستجابات السريرية الحرة. ويمكن استخدامه مع 16 نمطاً من التصوير الطبي، بما في ذلك الأشعة السينية، والتصوير المقطعي المحوسب، والموجات فوق الصوتية، والتصوير المجهري، كما أنه متوافق مع خوارزميات التعلم المعزز الشائعة، بما في ذلك تحسين السياسات النسبية للمجموعة (GRPO) وتحسين السياسة بالمحاذاة المباشرة (DAPO) وتحسين السياسة الموجَّه خطوةً بخطوة (GSPO).

وقد حظي هذا البحث بمنحة NVIDIA الأكاديمية لعام 2025.

يقول هشام شولاكال، الأستاذ المساعد في الرؤية الحاسوبية في جامعة محمد بن زايد للذكاء الاصطناعي وأحد مطوري MediX-R1: “لقد طورنا دالة مكافأة مركبة يمكنها العمل عبر خوارزميات التعلم المعزز المختلفة، وتُظهر أداءً مرتفعاً باستخدام كمية محدودة من بيانات التدريب”.

قارن شولاكال وزملاؤه أداء MediX-R1 بنماذج طبية أكبر حجماً عبر عدة معايير، ووجدوا أن MediX-R1 أظهر تحسناً قوياً في المهام السريرية المفتوحة، وحقق أفضل متوسط أداء عبر 17 معياراً. وقد تحقق ذلك رغم تدريبه على 51 ألف مثال تعليمي فقط.

تعاون الباحثون مع الأطباء عمير محمد ومحمد زيدان، اللذين ساعداهما على فهم العملية التي قد يمر بها الطبيب عند الوصول إلى تشخيص.

كما ساهم في الدراسة كل من سهيل شاجي مولابيلي، ومحمد عرفان كورباث، وفهد خان، وسلمان خان، وراو أنور.

آلية عمل الإطار MediX-R1

من مزايا التعلم المعزز أنه يمكن أن يساعد النموذج على التحسن دون الحاجة إلى كميات كبيرة من البيانات المعنونة من قبل البشر، وهو ما يمثل فائدةً كبيرةً في المجال الطبي حيث يتطلب إعداد هذه البيانات وقتاً وخبرةً من متخصصين.

يوضح مولابيلي، طالب دكتوراه في الرؤية الحاسوبية في جامعة محمد بن زايد للذكاء الاصطناعي وأحد مطوري MediX-R1، أن دالة المكافأة المركبة تتيح للنموذج التعلم من مجموعة بيانات محدودة، مع الاستمرار في إنتاج إجابات مفصلة ومبنية على السياق كما تتطلبه الأسئلة السريرية. ويقول: “نحن نعالج مشكلتين في آن واحد. نحن لا نحتاج إلى بيانات طبية معنونة مكلفة، كما طورنا نموذجاً يولد استجابات غنية بالمعلومات للمستخدم.”

يستقبل MediX-R1 صورة طبية وسؤالاً سريرياً، ويولد استجابةً منظمة تبدأ كسلسلة من خطوات الاستدلال، ثم إجابة نهائية. ويتم توجيه التدريب عبر أربع إشارات تغذية راجعة تشكل معاً دالة المكافأة المركبة.

تستخدم الإشارة الأولى نموذجاً لغوياً منفصلاً لتقييم ما إذا كانت إجابة النموذج صحيحة مقارنةً بالإجابة المرجعية. أما الإشارة الثانية، فهي مكافأة قائمة على التمثيلات المتجهية، تقيس التشابه (cosine similarity) بين الإجابة المرجعية والاستجابة المتوقعة في فضاء التمثيل المتجهي؛ حيث تُكافأ الاستجابات الأكثر تشابهاً. ويوضح مولابيلي أن مكافأة النموذج اللغوي ومكافأة التمثيلات المتجهية تكمل إحداهما الأخرى، وأن التآزر بينهما يؤدي إلى تحسين الأداء.

وقد لاحظ الباحثون أنه عند استخدام مكافأة واحدة فقط، يلجأ النموذج إلى ما يعرف بالتحايل على المكافأة، حيث يحاول تعظيمها بدلاً من إنتاج إجابات مفيدة. ويقول مولابيلي: “عندما جمعنا بين هاتين المكافأتين، بدأ نموذجنا فعلياً في التعلم”.

تفرض الإشارة الثالثة بنيةً محددةً للمخرجات، بما يضمن أن يفصل النموذج دائماً بين عملية الاستدلال والنتيجة النهائية.

أما الإشارة الرابعة، فتتطلب من النموذج تحديد نمط التصوير الطبي قبل أن يبدأ الاستدلال، مما يرسخ تحليله في السياق الصحيح. ويشير كورباث، طالب دكتوراه في الرؤية الحاسوبية والمشارك في تطوير MediX-R1، إلى أن فرض التنبؤ بنمط التصوير يساعد على تحسين الأداء، لأنه في غياب ذلك قد يخلط النموذج بين التصوير المقطعي المحوسب والتصوير بالرنين المغناطيسي أو غيرهما من الأنماط. ويضيف: “قد تبدو الصور متشابهة، وقد تكون الفروق دقيقة، لكن التفاصيل هي ما يصنع الفرق”.

كما تساعد مكافأة نمط التصوير على تقسيم المشكلة، بحيث إذا واجه النموذج صورةً من نوع معين، فإنه يوجه تحليله نحو الحالات الطبية المرتبطة بذلك النوع.

بنية الإطار MediX-R1

نتائج وفوائد إطار MediX-R1

قام الباحثون بضبط نماذج بصرية-لغوية بثلاثة أحجام مختلفة (2 مليار، و8 مليارات، و30 مليار معامل) باستخدام MediX-R1، وقارنوا أداءها بعدة نماذج طبية مفتوحة المصدر عبر 17 معياراً تغطي أسئلة سريرية نصية ومهام تعتمد على الصور.

تفوق MediX-R1 بحجم 8 مليارات معامل على نموذج MedGemma 27B من Google DeepMind، رغم أن حجمه يقارب ثلثه فقط، وتم تدريبه على جزء بسيط من البيانات. فقد تم تدريب MedGemma 27B على أكثر من 30 مليون مثال، مقارنةً بـ 51 ألف مثال فقط لـ MediX-R1.

أما MediX-R1 بحجم 30 مليار معامل، فقد حقق أعلى متوسط دقة بلغ 73.6% بين جميع النماذج المختبرة. وكانت أكبر التحسينات مقارنةً بالنماذج الأخرى في المهام المفتوحة، مثل التلخيص وتوليد التقارير.

يوضح شولاكال أن الفريق “تمكن من تحقيق أداء يضاهي أو يتفوق على نماذج تم تدريبها باستخدام عدد أكبر بكثير من وحدات المعالجة الرسومية وكمية أكبر بكثير من البيانات”، مشيراً إلى أن الخلاصة هي أن الخوارزميات والأساليب المناسبة يمكن أن تتيح تدريب نموذج لغوي طبي قوي دون الحاجة إلى موارد حوسبة ضخمة أو بيانات معنونة بكثافة.

وتعد النسخة ذات الملياري معامل صغيرة بما يكفي لتعمل محلياً على حاسوب محمول أو حتى هاتف ذكي.

المشروع مفتوح المصدر، وتتوفر أوزان النموذج، وشيفرة التدريب، وإطار التقييم، ومجموعات البيانات عبر صفحة المشروع.

أخبار ذات صلة

الخميس، 04 يونيو 2026

نموذجان أفضل من واحد لفهم الفيديوهات

نجح فريق بحثي من جامعة محمد بن زايد للذكاء الاصطناعي في تطوير نهج مبتكر لفهم مقاطع الفيديو،.....

اقرأ المزيد

الأربعاء، 03 يونيو 2026

من "الوسم الثابت" إلى "التشفير المتغير": مقاربة جديدة لتوثيق الفيديوهات المولَّدة آلياً

فريق بحثي من جامعة محمد بن زايد للذكاء الاصطناعي ينجح في تطوير نظام لتوليد العلامات المائية، قد.....

اقرأ المزيد

الثلاثاء، 02 يونيو 2026

نهج جديد لتكييف نماذج الرؤية الحاسوبية مع الصور الطبية

باحثو من جامعة محمد بن زايد للذكاء الاصطناعي يطورون نهجاً جديداً يمكّن أنظمة الذكاء الاصطناعي من تفسير.....

اقرأ المزيد

كيف يمكن للتعلم المعزز أن يساعد أنظمة الذكاء الاصطناعي الطبي على التفكير مثل الطبيب

آلية عمل الإطار MediX-R1

نتائج وفوائد إطار MediX-R1

أخبار ذات صلة

نموذجان أفضل من واحد لفهم الفيديوهات

من "الوسم الثابت" إلى "التشفير المتغير": مقاربة جديدة لتوثيق الفيديوهات المولَّدة آلياً

نهج جديد لتكييف نماذج الرؤية الحاسوبية مع الصور الطبية

من نحن

الموارد

البرامج

التقويم

كيف يمكن للتعلم المعزز أن يساعد أنظمة الذكاء الاصطناعي الطبي على التفكير مثل الطبيب

آلية عمل الإطار MediX-R1

نتائج وفوائد إطار MediX-R1

أخبار ذات صلة

نموذجان أفضل من واحد لفهم الفيديوهات

من "الوسم الثابت" إلى "التشفير المتغير": مقاربة جديدة لتوثيق الفيديوهات المولَّدة آلياً

نهج جديد لتكييف نماذج الرؤية الحاسوبية مع الصور الطبية

اشترك في "ذي نود"