تدريب الذكاء الاصطناعي على توقع شكل الخلايا قبل أي تجارب - MBZUAI MBZUAI

تدريب الذكاء الاصطناعي على توقع شكل الخلايا قبل أي تجارب

الجمعة، 14 نوفمبر 2025

إذا سبق لك أن حاولت توقّع كيف ستتغيّر هيئة الخلية بعد إعطائها دواءً أو إجراء تعديل جيني، فستدرك أن الأمر مزيج من العلم والفن، وغالباً ما يكون عملية مكلفة تقوم على التجربة والخطأ، فتصوير آلاف الشروط التجريبية يستغرق وقتاً طويلاً؛ أمّا استكشاف ملايين الاحتمالات فغير ممكن عملياً.

تقترح ورقة بحثية جديدة في مجلة نيتشر كوميونيكيشنز مساراً مختلفاً: يتمثل في محاكاة صور الخلايا بعد التدخّل مباشرةً اعتماداً على قراءات جزيئية، ما يتيح استعراض المورفولوجيا (الشكل الخلوي) المتوقع قبل المباشرة بأي تجربة مخبرية. يطلق الفريق على نموذجهم اسم MorphDiff، وهو نموذج انتشار توليدي موجَّه بالنسخوم (Transcriptome)، أي نمط الجينات التي يرتفع أو ينخفض تعبيرها الجيني عقب أي تدخّل.

بشكل عام، يعيد هذا النهج ترتيب سير العمل المألوف. فالتصوير عالي الإنتاجية طريقة مثبتة لاكتشاف آلية عمل المركّبات أو رصد النشاط الحيوي، لكن إعداد ملفات مورفولوجية لكل دواء مرشّح أو لكل هدف من أهداف CRISPR ليس أمراً قابلاً للتوسّع. يتعلّم MorphDiff من حالات تتوافر فيها بيانات التعبير الجيني ومورفولوجيا الخلية معاً، ثم يستخدم ملف التعبير الجيني L1000 وحده بوصفه شرطاً لتوليد صور واقعية لما بعد التدخّل: إمّا توليداً من الصفر، أو بتحويل صورة “ضابطة” إلى نظيرتها “بعد التدخّل”.

وتتمثّل خلاصة النتائج في أنه يحقق دقة تنافسية على تدخلات محجوزة للاختبار (غير مرئية أثناء التدريب) عبر مجموعات بيانات كبيرة للأدوية والتدخلات الجينية، وأن مكاسب استرجاع آلية العمل (MOA retrieval) يمكن أن تضاهي ما نحصل عليه من الصور الحقيقية.

ينطلق هذا البحث بقيادة باحثين من جامعة محمد بن زايد للذكاء الاصطناعي من ملاحظة بيولوجية أساسية: تعبير الجينات هو ما يقود في النهاية إلى بروتينات ومسارات تُشكّل ما نراه من هيئة الخلايا تحت المجهر. صحيح أن العلاقة ليست واحداً لواحد، لكن هناك قدراً كافياً من الإشارة المشتركة يسمح بالتعلّم. كما أن الاشتراط على النسخوم يمنح ميزة عملية إضافية: بيانات L1000 المتاحة علناً أكثر بكثير من البيانات المقترنة بالصور المورفولوجية، ما يسهل تغطية مساحة واسعة من التدخلات. وبعبارة أخرى، عندما يظهر مركّب جديد، غالباً ما تستطيع العثور على “بصمته” الجينية، التي يمكن لـMorphDiff الاستفادة منها.

 آلية عمل نموذج MorphDiff

يمزج MorphDiff على المستوى التقني بين مكوّنين أولهما هو مشفّر-مفكّك تغايري للمورفولوجيا يضغط الصور المجهرية متعددة القنوات (خمس قنوات) في فضاء كامن مضغوط، ويتعلّم إعادة بنائها بدقة تمثيلية عالية، والثاني هو نموذج انتشار في الفضاء الكامن يتعلّم إزالة الضوضاء تدريجياً عن العينات داخل ذلك الفضاء الكامن، مع توجيه كل خطوة من خطوات إزالة الضوضاء بواسطة متجه L1000 عبر آلية الانتباه.

الانتشار ملائم هنا: فهو متين بطبيعته أمام الضوضاء، كما أن النسخة العاملة في الفضاء الكامن فعّالة بما يكفي للتدريب مع الحفاظ على تفاصيل الصورة. ويطبّق الفريق نمطين: التوليد من الجين إلى الصورة (G2I) (الانطلاق من ضجيج عشوائي مع الاشتراط على النسخوم)، والتحويل من صورة إلى صورة (I2I) (دفع صورة ضبط نحو حالتها بعد التدخّل باستخدام الشرط النسخومي نفسه). ولا يتطلب النمط الثاني إعادة تدريب بفضل إجراء على نمط SDEdit، وهو مفيد عندما تريد تفسير التغيرات قياساً إلى عينة الضبط.

ليس التحدي هو توليد صور “جميلة” بصرياً، بل توليد صور أمينة بيولوجياً. وهنا تحاول الورقة الجمع بين الاثنين: فمن جانب التوليد، يُقارن MorphDiff بخطوط أساس من شبكات GAN ونماذج انتشار أخرى باستخدام مقاييس معيارية مثل FID وInception Score والتغطية (Coverage) والكثافة (Density) وقياس CMMD القائم على CLIP. وعبر تقسيمات الاختبار في مجموعات بيانات JUMP (جينية) وCDRP/LINCS (دوائية)، وغالباً ما يحتل نمطا MorphDiff المركزين الأول والثاني، مع إجراء اختبارات دلالة إحصائية عبر عدة بذور عشوائية أو ألواح ضبط مستقلة. والنتيجة ثابتة: وفاء وتنوّع أفضل، خصوصاً في التدخلات خارج التوزيع (OOD) حيث تكمن القيمة العملية.

وأكثر ما يثير اهتمام علماء الأحياء هو أن المؤلفين يتجاوزون جماليات الصورة إلى سمات المورفولوجيا نفسها. فهم يستخرجون مئات السمات عبر CellProfiler (مثل القوام، وشدة الإشارة، والحُبيبية، والارتباطات بين القنوات)، ثم يسألون: هل تتطابق توزيعات السمات المتولدة مع المرجع الحقيقي.

في المقارنات المباشرة، تتوافق “سُحب السمات” في MorphDiff مع البيانات الحقيقية بصورة أوثق من خطوط أساس مثل IMPA، وتُظهر الاختبارات الإحصائية أن أكثر من 70% من توزيعات السمات المتولدة لا يمكن تمييزها إحصائياً عن الحقيقية، كما تُبيّن مخططات التشتت بحسب السمة أن النموذج يلتقط فروقاً عن الضبط في السمات الأكثر تأثراً بالتدخلات. والأهم أنه يحافظ أيضاً على بنية الارتباط بين التعبير الجيني وسمات المورفولوجيا، مع توافق أعلى مع الحقيقة مقارنة بطرق سابقة—وهو دليل على أنه يتعلّم ما هو أعمق من “أسلوب بصري” سطحي.

وتوسّع نتائج الأدوية هذه القصة إلى آلاف المعالجات. فباستخدام تضمينات DeepProfiler بوصفها “بصمة” مورفولوجية مضغوطة، يبيّن الفريق أن الملفات المتولدة تظل تمييزية: فالمصنّفات المدرَّبة على التضمينات الحقيقية تفصل أيضاً بين التضمينات المتولدة بحسب التدخل، كما تُحفَظ المسافات الثنائية (مدى التشابه أو الاختلاف بين كل دواءين) بين تأثيرات الأدوية.

وهذا مهم للتطبيق العملي النهائي الذي يهتم به الجميع: استرجاع آلية العمل (MOA). إذا أُعطيت ملفاً استعلامياً، هل تستطيع العثور على أدوية مرجعية تشترك في الآلية نفسها؟ لا تتفوّق المورفولوجيات المتولدة بواسطة MorphDiff على خطوط أساس توليد الصور السابقة فحسب، بل تتجاوز أيضاً الاسترجاع المعتمد على التعبير الجيني وحده، وتقترب من الدقة التي تحققها الصور الحقيقية. وفي تجارب الاسترجاع من نمط Top-k، يبلغ متوسط التحسن مقارنةً بأقوى خط أساس 16.9%، و8.0% مقارنةً بنهج “النسخوم فقط”، مع إظهار المتانة عبر عدة قيم لـk ومقاييس مثل متوسط الدقة المتوسّطة (mAP) ومعدلات الإثراء. وهذه إشارة قوية إلى أن المورفولوجيا المُحاكاة تحمل معلومات مكمّلة للبنية الكيميائية والنسخوم—معلومات كافية للمساعدة في العثور على آليات “متشابهة” حتى عندما تكون الجزيئات نفسها غير متشابهة شكلياً.

القيود والاتجاهات المستقبلية

تسرد الورقة أيضاً بعض القيود الحالية التي تلمّح إلى فرص تحسين لاحقة. لا يزال الاستدلال (Inference) في نماذج الانتشار بطيئاً نسبياً؛ ويقترح المؤلفون استخدام خوارزميات أخذ عينات (Samplers) أحدث لتسريع التوليد. كما أن عاملَي الزمن والتركيز—وهما عاملان يهمّان علماء الأحياء—غير ممثلين صراحة بسبب قيود البيانات؛ ويمكن للمعمارية أن تستوعبهما كاشتراطات إضافية عندما تصبح مجموعات بيانات متطابقة متاحة. وبما أن MorphDiff يعتمد على التعبير الجيني بعد التدخّل بوصفه مدخلاً، فإنه لا يستطيع توليد مورفولوجيا لتدخلات لا تتوافر لها قياسات نسخومية. لذلك، يقترح الباحثون ربطه بنماذج تتنبأ بالتعبير الجيني لتدخلات غير مرصودة. وتذكر الورقة GEARS مثالاً). وأخيراً، تضعف القدرة على التعميم كلما ابتعدنا عن توزيع التدريب؛ وستساعد مجموعات بيانات متعددة الوسائط أكبر وأفضل مواءمة، وكذلك الاشتراط على وسائط إضافية مثل البُنى الكيميائية، والأوصاف النصية، أو بيانات الكروماتين.

ما دلالات ذلك على أرض الواقع؟ تخيّل فريق فحص دوائي لديه مكتبة L1000 كبيرة لكن بميزانية تصوير محدودة. هنا يصبح MorphDiff بمثابة “مساعد ظاهري” (Phenotypic Copilot): يولّد مورفولوجيات متوقعة لمركّبات جديدة، ويصنفها في عناقيد بحسب تشابهها مع آليات معروفة، ثم يساعد على تحديد ما يستحق التصوير للتحقق. ولأن النموذج يبرز أيضاً تحولات قابلة للتفسير في السمات، يمكن للباحثين فهم الآلية الداخلية لكيفية عمل النموذج: هل تغيّر نسيج الشبكة الإندوبلازمية (ER) وشدة إشارة الميتوكوندريا كما نتوقع لمثبِّط EGFR؟ وهل انتهى مركّبان غير متشابهين بنيوياً في “نطاق” ظاهري واحد؟ (حيز ظاهري مشترك) هذه الأنواع من الفرضيات هي ما يسرّع البحث عن الآليات وإعادة توظيف الأدوية.

والصورة الأكبر هي أن الذكاء الاصطناعي التوليدي بلغ أخيراً مستوى من الدقة يجعل “المجهرية الحاسوبية” (In silico microscopy) قادرة على أداء دور عملي في المراحل الاستكشافية الأولى. لقد رأينا نماذج تحويل النص إلى صورة تنتشر انتشاراً واسعاً في المجالات الاستهلاكية؛ وهنا يُظهر نموذج يحوّل النسخوم إلى مورفولوجيا أن آليات الانتشار نفسها يمكن أن تؤدي عملاً علمياً مفيداً—مثل التقاط أنماط دقيقة متعددة القنوات والحفاظ على العلاقات التي تجعل هذه الصور أكثر من مجرد “زينة”. لن يحل هذا النموذج محل المجهر، لكنه قد يقلّل عدد الألواح اللازمة للوصول إلى النتائج المهمة، موفّراً وقتاً ومالاً يمكن استثمارهما في التحقق من النتائج الواعدة التي تستحق المتابعة.

نُشر هذا المقال لأول مرة في عدد أكتوبر 2025 من مجلة معهد الهندسة الكهربائية IEEE Spectrum.

أخبار ذات صلة

thumbnail
الاثنين، 08 ديسمبر 2025

مقياس جديد يساهم في تحسين أداء خوارزميات تخطيط مسار مركبات التوصيل ورفع كفاءة الخدمات اللوجستية

مقياس مبتكر لتقييم أداء خوارزميات تخطيط مسارات مركبات التوصيل، يساهم في تعزيز كفاءة وفعالية الخدمات اللوجستية الحديثة.

  1. تعلّم الآلة ,
  2. المؤتمرات ,
  3. neurips ,
  4. الرؤية الحاسوبية ,
  5. البحوث ,
  6. اللوجستيات ,
  7. مقياس معياري ,
  8. خدمات التوصيل ,
اقرأ المزيد
thumbnail
الجمعة، 05 ديسمبر 2025

"K2": نموذج مفتوح المصدر بقدرات جد متطورة

"معهد النماذج التأسيسية" التابع للجامعة يعلن عن إطلاق أحدث نسخة من نموذج K2، الذي يضم 70 مليار.....

  1. مفتوح المصدر ,
  2. النماذج التأسيسية ,
  3. معهد النماذج التأسيسية ,
  4. الاستدلال ,
  5. K2 ,
  6. نموذج K2 ,
اقرأ المزيد