في حب البحث

مقال دفعة عام 2022

Friday, January 20, 2023

يقرّ كلٌ من حنونة بانجالت (الهند) ومحمد معاز (باكستان) أنه شغوف بإجراء البحوث، وقد حقق الطالبان حلمهما بنشر أعمالهما البحثية في أهم المؤتمرات في أثناء متابعة الدراسة لحيازة شهادة الماجستير في مجال الرؤية الحاسوبية في جامعة محمد بن زايد للذكاء الاصطناعي. ويكمل الطالبان درجة الدكتوراه في الجامعة، بعد أن أحرزا معدلاً تراكمياً مثالياً يبلغ 4.0/4.0 وكانا من أبرز الطلاب الواعدين في دفعة عام 2022.في خلال العامين الماضيين، أمضى هذان الطالبان معظم ساعات اليوم في البحث والاختبار والتجربة، لكنهما يقولان إن تركيزهما يبقى منصباً على جودة البحوث أكثر من عددها، وأيضًا على مواكبة التحديات الأكثر إلحاحاً والمواضيع المستكشَفة حالياً في مجال الرؤية الحاسوبية. وهما يعتبران أن الفضل يعود إلى القوة الحاسوبية العالية التي تتمتع بها جامعة محمد بن زايد للذكاء الاصطناعي، والدعم المعيشي الذي تقدمه لطلابها، والمكانة المرموقة التي يحتلها أعضاء الهيئة التدريسية، ما دفعهما بشكل أساسي إلى الرغبة في البقاء في أبوظبي في أول جامعة في العالم للدراسات العليا والبحوث المتخصصة في مجال الذكاء الاصطناعي.

يتمتع هذان الطالبان المتفوقان بخلفية صناعية تقنية، وقد تمكّنا مع ذلك من الحصول على موافقة المؤتمر الأوروبي للرؤية الحاسوبية 2022 على ورقتهما البحثية المشتركة الأولى بعنوان “اكتشاف الأشياء ذات الفئة الحيادية باستخدام محوّل متعدد الصيغ”؛ فكانت هذه الورقة المنشور الأول المقبول على الإطلاق من طلاب جامعة محمد بن زايد للذكاء الاصطناعي في مؤتمر رفيع المستوى حول الرؤية الحاسوبية. وفي عام 2022 أيضاً، قُبلت ورقتهما البحثية الثانية بعنوان “سد الفجوة بين التمثيل على مستوى الصورة والشيء لاكتشاف المفردات المفتوحة” في مؤتمر نُظُم معالجة المعلومات العصبية للعام 2022؛ فكانت الورقة البحثية الطلابية الأولى من جامعة محمد بن زايد للذكاء الاصطناعي في هذا المؤتمر البارز.

تعليقاً على أبحاثهما، قال الدكتور سلمان خان، المشرف على حنونة والأستاذ المشارك في قسم الرؤية الحاسوبية في جامعة محمد بن زايد للذكاء الاصطناعي، والمؤلف المشارك في البحثين المذكورين أعلاه: “معاز وحنونة هما من بين أفضل الطلاب الذين استطعنا جذبهم في الدفعة الأولى المقبولة في جامعة محمد بن زايد للذكاء الاصطناعي. وأنا معجَب بفضولهما وشغفهما اللذين دفعاهما إلى العمل الجاد الواضح في معالجة الأسئلة البحثية الصعبة. كما أنني سعيد بالنجاحات الرائعة التي حققاها في العامين الماضيين، وآمل أن يصبح هذان النجمان الصاعدان من الذين يحملون اسم هذه المؤسسة الشابة وينشرون سمعتها الطيبة”.

الانخراط في مجتمع البحث

لم يكن هذان الطالبان يتمتعان بأي خلفية في مجال البحث، لذا يعربان عن الشكر للمشرفَين على كلٍ منهما، اللذين لم يؤمنا بهما فحسب، بل علّماهما أيضًا كيفية إجراء البحوث وكتابة التقارير على المستوى العملي. وتوضح حنونة ذلك قائلةً: “يأتي كلانا من خلفية صناعية تقنية، ومعرفة المشرفَين علينا هائلة في عالَم البحث. ففي غضون فترة زمنية قصيرة، تمكّنا من تعليمنا بطريقة جعلتنا نفهم ثقافة البحث. وعلّمانا ألا نعتمد عليهما كثيرًا، وأن نتخذ قراراتنا بأنفسنا. وقد وقعتُ في حب البحوث وأريد أن أكون جزءًا من مجتمعٍ سيغيّر وجه المستقبل”.


أريد أن أصبح باحثاً صناعياً. وأحاول أن أتعرّف إلى التقنيات الجديدة، وأن أتعلم كيفية حل المشكلات بواسطة الأفكار الجديدة، وأن أفهم عملية البحث

محمد معاز
طالب دكتوراه في جامعة
محمد بن زايد للذكاء الاصطناعي

هذا الاستقلال الذي يتطلبه البحث هو أكثر ما يحبه معاز، فيقول: “السبب الذي جعلني أقع في حب البحث هو أنه من المثير للاهتمام أن أكون جزءًا من مجتمعٍ يبتكر باستمرار أفكارًا جديدة من أجل تحسين نوعية حياة الإنسان. وفي البحث، على عكس الوظائف التي يمتد دوامها من الساعة التاسعة صباحاً إلى الخامسة مساءً، نعمل في الغالب وفق وتيرتنا الخاصة. فيوفر ذلك فرصة التمتع بالاستقلال في الأفكار والأفعال، إذ يستطيع الباحثون استكشاف أفكار وطرق جديدة من دون الخضوع لقيود كثيرة. وقد يؤدي ذلك إلى تطوير تقنيات جديدة يمكنها معالجة بعض التحديات الأكثر إلحاحاً التي نواجهها الآن”.

لم يحلم أيٌ منهما بنشر أعماله في المؤتمرات الكبرى، وقد تحقق ذلك بفضل جامعة محمد بن زايد للذكاء الاصطناعي. فيقول معاز في هذا السياق: “لم أتخيل قط أنني سأحقق ذلك بهذه السرعة وهذه الكفاءة، فأصبحتُ متعطشًا لتحقيق المزيد. وسيكون ملفي البحثي جيداً جداً بعد الدكتوراه في ظل بقائي مع المشرف نفسه”.

من جهته، أشاد المشرف على معاز ونائب رئيس القسم والأستاذ المشارك في قسم الرؤية الحاسوبية في جامعة محمد بن زايد للذكاء الاصطناعي، فهد خان، بالنجاحات المبكرة التي حققها الطالبان قائلًا: “أصبحا ينتميان الآن إلى الاتحادات البحثية الكبرى، ويشكلان جزءًا من مجتمع البحث”.

في هذا السياق، أضافت حنونة: “أتذكر ما قاله الدكتور فهد لي، وهو أنني لن أفهم حقاً أهمية نشر الأعمال في المؤتمرات رفيعة المستوى، لكن حين أستوعب ذلك وأصبح ضمن أوساط الباحثين، سأفهم حينئذٍ ذلك الشعور”. أما معاز، فاعتبر أنه: “يمكن أن يكون الدعم والمشاركة من المجتمع البحثي ملهمَين بشكلٍ لا يُصدَّق، وأن يدفعاك إلى إنتاج أعمال ذات جودة عالية. كما أن هذا المجتمع يجمع المجموعات البحثية الصغيرة والعمالقة مثل جوجل ومايكروسوفت”.

معاز متحمس ليكون جزءًا من مجتمع المصادر المفتوحة والباحثين الذين يعملون بشكل تعاوني من أجل حل مشكلات العالم الحقيقي، فيقول: “أريد أن أصبح باحثاً صناعياً. وأحاول أن أتعرّف إلى التقنيات الجديدة، وأن أتعلم كيفية حل المشكلات بواسطة الأفكار الجديدة، وأن أفهم عملية البحث”.

تحسين القدرة على تحديد الأشياء باستخدام النص

يعمل كلا الطالبَين على موضوعَين متشابهَين ضمن أبحاث الدكتوراه، ويساعدان في حل إحدى المشكلات الأساسية في مجال الرؤية الحاسوبية، وهي الاكتشاف العام للأشياء. ويتمحور الموضوع الرئيسي للبحث حول التعميم واستخدام الفهم متعدد الصيغ من الرؤية والنص، بهدف تحسين التفكير المنطقي للآلات ونشرها على الأجهزة المحمولة. وحين باشرا ببحث الماجستير حول هذا التدريب المسبق الخاص بالصورة واللغة أو المعاينة المسبقة للصورة والنص، كان الموضوع جديداً تماماً وقد تناولته أقل من عشر أوراق بحثية في جميع أنحاء العالم.

تشرح حنونة البحث قائلةً: "يسمح الجمع بين اللغة والنص أو البيانات متعددة الصيغ، عند تدريب النماذج، بتحقيق قدرات أكبر على مستوى التعميم. وعلى سبيل المثال، سيكون النموذج المدرَّب على الصور الواقعية قادراً أيضاً على فهم صور الأقمار الصناعية والرسوم المتحركة وأنواع أخرى من الصور. وعلاوةً على ذلك، تميل النماذج المدرَّبة عبر استخدام نهج متعدد الصيغ إلى التمتع بنطاق أوسع من المفردات، فتقدر على التعرف إلى الشيء حتى لو لم تصادفه من قبل. على سبيل المثال، من خلال استخدام فهم النموذج للّغة، سيتمكّن هذا النموذج الذي لم يصادف حماراً وحشياً في أثناء التدريب من التعرف إليه. إلا أن تطبيق البحث على سيناريوهات العالم الحقيقي يبقى مهمة صعبة، وينصب تركيزي على مواجهة هذا التحدي وتطوير النماذج التي تعمم بشكل فعّال، من أجل استخدامها في مختلف التطبيقات مثل السيارات ذاتية القيادة والأنظمة الأمنية وإدارة حركة المرور والأنشطة الرياضية الاحترافية".

حنونة بانجالت
طالبة دكتوراه في جامعة محمد بن زايد للذكاء الاصطناعي.

 

تطبيقات العالَم الحقيقي

في الواقع، ما من تطبيقٍ لن يستفيد من عملية اكتشاف الأشياء أو قد لا تكون هذه العملية جزءًا منه. إذ يُستخدَم اكتشاف الأشياء على نطاق واسع ويمكنه تعزيز عدة تطبيقات على مستوى مراقبة حركة المرور، وتحقيق السلامة في السيارات ذاتية القيادة، وتوفير الأمن، وممارسة الأنشطة الرياضية، والتعرف إلى الوجوه، وغيرها من المجالات. إلا أن أحدث نماذج الصناعة الحالية التي يتم تدريبها باستخدام كاشف منفصل للأشياء ومع وضع المهمة النهائية في الاعتبار بحاجة إلى تحسين. فبإمكانها اكتشاف ما تعرفه فحسب، وليس ما لا تعرفه. ويتمثل جوهر المشكلة في منحها المزيد من الطرق للتعميم، ويعتقد كلٌ من حنونة ومعاز أن استخدام الإشراف اللغوي إلى جانب الصور سيجعل النماذج أكثر دقة وأقل تكلفة من الناحية التجارية.

محمد معاز
طالب دكتوراه في جامعة محمد بن زايد للذكاء الاصطناعي

توضِح حنونة أن "أداء النماذج التقليدية في اكتشاف الأشياء محدود بسبب تَعَرُّضها لمجموعة محددة من البيانات أو الأشياء، فيتم تدريب النماذج بشكل تقليدي على بيانات الصور فحسب. أما في بحثنا، فنقوم بتعزيز ذلك من خلال دمج النص في خلال مرحلة التدريب المسبق، باستخدام مجموعة كبيرة من النصوص والصور. وقد اعتُمد هذا النهج على أساس أنه يحاكي الطريقة الطبيعية التي يتعلم بها البشر، من خلال استيعاب المعلومات عبر القراءة والاستماع والمراقبة، ثم ربط الأفكار. فقد لا نكون على دراية بالأشياء كلها، لكن من خلال الإسناد الترافقي للنصوص والصور والمعارف المسبقة، يمكننا تحديدها".

يلخّص معاز ذلك قائلاً: “تتألف رسالتنا من شقين. فأولاً، لا يجب أن تقتصر العملية المفتوحة لاكتشاف الأشياء على الصور فحسب، بل يجب دمج النصوص أيضاً. وثانياً، سيؤدي استخدام كمية كبيرة من النصوص والبيانات المرئية من أجل تدريب النموذج مسبقاً إلى تحسين القدرة على اكتشاف الأشياء ذات الفئة الحيادية، وهذا أمر حيوي بالنسبة إلى مختلف المهام والتطبيقات النهائية. وفي حين أن التصنيف يشكل مهمة سهلة نسبياً، سيؤدي إنشاء نموذج متعدد الصيغ ويتقن اكتشاف الفئات الحيادية ومعمَّم على الفئات والمجالات كلها، إلى تحقيق نتائج باهرة.”

معاز وحنونة هما من بين 12 طلابٍ يكملون دراستهم لنيل شهادة الدكتوراه، من أصل 52 خريج ماجستير من الدفعة الأول لعام 2022  سيحصلون رسمياً على شهاداتهم في 30 يناير 2023.

أخبار ذات صلة

thumbnail
Tuesday, November 26, 2024

النماذج اللغوية الكبيرة وفهم انفعالات الإنسان وعواطفه

فريق بحثي من جامعة محمد بن زايد للذكاء الاصطناعي وجامعة موناش يبحث في مدى قدرة النماذج اللغوية.....

  1. التعاطف ,
  2. انفعالات الإنسان ,
  3. معالجة اللغة الطبيعية ,
  4. EMNLP ,
  5. النماذج اللغوية الكبيرة ,
  6. البحوث ,
اقرأ المزيد