تُعد قدرة الآلة على التعرف على الأجسام وتحديدها باستخدام الصور عنصراً أساسياً، تَدْخُلُ تطبيقاتُه العملية في تكنولوجيا الرؤية الحاسوبية التي أصبحت استعمالاتُها تسجل اليوم انتشاراً واسعاً على مستوى العديد من الأنشطة التي نذكر منها القيادة الذاتية وتحليل الصور الطبية.
الملاحظ أن تقدم قدرات الآلات على التعرف على الأجسام وتحديدها، قد أسهَم في تحقيق تطور ملفت على نطاق عدد كبيرٍ من القطاعات، وذلك فقط من خلال تعزيز قدرة هذه الأخيرة على التفاعل مع العالم المادي المحيطِ بها وتمكينها من فهم وتفسير مكوناته بدقة أكثر ودون أي تدخل.
قد يبدو الأمر بسيطاً غَيرَ أن تدريب الآلات وتمكينها من التعرف على الأجسام عادةً ما يتطلب وقتاً وجهداً كبيرين، بل وأكثر من هذا فهو عمل مضن ودقيق يقوم به المطورون على مستوى شرح الصور وتصنيفها في مجموعات بيانات تُستخدم لتدريب نماذج الرؤية الحاسوبية التي تتخذ من هذه التصنيفات المشروحة مرجعاً يفسر للآلة كيفية فهم الأشياء المختلفة الموجودة في الصور.
ويمكن القول إن أهمية المُصَنِّفِ ودورِه في تطوير قدرات نماذج الرؤية الحاسوبية، تتجلى بالأساس في تحديد الأجسام ومكانها في الصور وشرح نوعها وتصنيفها ضمن فئات، مثل فئتي “القطط” و”الكلاب”؛ وهذا التصنيف المُرفق بالشرح يساعد النموذج عند تعامله مع صورة لكلب هاسكي في الثلج تحديد نوعه على أنه ينتمي إلى فئة الكلاب.
التمييز بين المعروف وغير المعروف
تكون هذه المقاربة صالحة عندما يتعامل النموذج فقط مع صور لفئتي القطط والكلاب، غير أن الأمر يختلف عندما يتعامل النموذج مع فئة مختلفة من الحيوانات غير تلك التي تم تدريبه عليها، مثل فئة الدببة، التي قد يصنفها النموذج ضمن فئة الكلاب، وهنا تكمن مشكلة هذه النماذج التي تكون عاجزة في مثل هذه الحالات على التمييز بين الفئات التي دُرِّبَت عليها والتي لم تُدرَّب عليها.
ويوضح هشام شولاكال، الأستاذ المساعد في قسم الرؤية الحاسوبية، هذه المشكلة قائلاً أن: “مثل هذه الأنواع من النماذج تَبنِي توقعاتها بترجيح أقرب الاحتمالات”. ولحلِّ هذه الإشكالية التي تطرحها هذه النماذج في هذه الحالة، يركز شولاكال عملَهُ على تعزيز إمكانات مقاربة “التعرف على الأجسام في العالم المادي المفتوح“، التي تزود الآلة بالقدرة على التمييز بين الأجسام المعروفة لديها وغير المعروفة، ثم تعلم تصنيف هذه الأخيرة لاحقاً بمجرد تدريب النموذج على كيفية القيام بذلك.
يذكر أن البروفيسور شولاكال سيعرض، مع طالب الدكتوراه ساهال شاجي مولابيلي وطالب الماجستير سينغ جيلوت، آخر ما توصلوا إليه في هذا المجال البحثي خلال فعاليات مؤتمر 'جمعية النهوض بالذكاء الاصطناعي' السنوي الثامن والثلاثين، المقرر انعقاده في وقت لاحق من هذا الشهر في فانكوفر، كندا. يشار أيضاً إلى أن مولابيلي هو المؤلف الرئيسي للدراسة البحثية التي سيقدمها تحت عنوان: 'التعرف الشبه خاضع للإشراف على الأجسام في العالم المادي المفتوح'.
صُممت تطبيقات نماذج الرؤية الحاسوبية المتاحة للتعرف على الأجسام في العالم المادي المفتوح ضمن بيئات تتغير فيها أنواع الموجودات وأشكالها بمرور الوقت ما يستلزم قدرة هذه النماذج على التكيف لاستيعاب مدخلات جديدة دون الحاجة إلى معاودة تدريبها من البداية ما سيحتاج إلى الكثير من الوقت والمال.
وتبقى، مع هذا، نماذج الرؤية الحاسوبية من هذا النوع قابلة للتطور، رغم حاجتها – يقول مولابيلي – إلى مَن يقوم فعلياً بتصنيف وشرح الأجسام الجديدة التي سيحتاج النموذج إلى التدرب عليها؛ فعلى سبيل المثال – يُضيف مولابيلي – أن تدريب مثل هذه النماذج لتتعرف على الدوارات المرورية باستخدام صور الأقمار الاصطناعية، يجب على المصنف (Annotator) أن يقوم بتحديدها فعلياً في هذه الصور قبل أن تتم إعادة تدريب النموذج.
ولا يعتقد شولاكال، في هذا الصدد، أن إعادة تدريب النموذج هي الخيار الأنسب للشركات التي تعتمد أعمالها على استخدام تطبيقات هذا النوع من النماذج التي ستكلف إعادة تدريبها على الفئات الجديدة الانتظار لأشهر طويلة.
تقليل الحاجة إلى الشرح والتصنيف
وبهدف تقليل الحاجة إلى شرح تصنيفات جديدة، اقترح فريق عمل الجامعة الذي يضم شولاكال؛ ومولابيلي؛ وأبهيشيك سينغ غيلوت؛ وفهد خان – أستاذ الرؤية الحاسوبية؛ وراو محمد أنور – أستاذ مساعد في قسم الرؤية الحاسوبية نهجاً يمكّن المستخدمين من إضافة فئات جديدة إلى تطبيقات التعرف على الأجسام مع الحد الأدنى من الشرح الأمر الذي أصبحت معه نماذج هذه التطبيقات قادرة على التمييز بين ما تعرفه وما لا تعرفه.
وتوضيحاً، قال شولاكال إن النموذج الذي طوره فريق العمل في الجامعة، سيمكن المصنف من تحديد الفئات الجديدة مع شرح لبعض الأمثلة من كل فئة“. مضيفاً أن اعتماد هذا النهج يمكن النموذج من التعرف على الأجسام واستيعاب مدخلات الفئات المضافة حديثا بشكل تدريجي اعتماداً على عدد قليل من الأمثلة المصنفة والمشروحة على عكس النهج الذي يعتمد تصنيف كل الفئات المستجدة وشرحها بالكامل.
كما طور الفريق إلى جانب هذا هيكلية هندسية جديدة لتمكين النموذج الجديد من إنجاز هذه المهام وأطلقوا عليها اسم “محول التعرف على الأجسام في العالم المادي شبه خاضع للإشراف” أوSS-OWFormer . وأوضح مولابيلي أن فريق العمل اعتمد في نهجه على وسم بعض الصور ثم قدرات الذكاء الاصطناعي التي وُظِّفَت لمساعدة نموذج الرؤية الحاسوبية على التعلم من التعليقات/الشروحات التوضيحية المحدودة.
وأظهر الباحثون أيضاً أن SS-OWFormer كان قادراً وعلى نحو جيد من التعامل مع الأشياء المعروفة لديه وغير المعروفة مقارنةً بالتكنولوجيا نماذج الرؤية الحاسوبية المتاحة حالياً. كما أثبتوا أن الهيكلية الهندسية التي طوروها حققت أداءً مشابهاً للنماذج الحالية مع استخدام بيانات تدريب أقل بكثير مع تصنيف 10% فقط من البيانات.
يذكر أن الدراسة التي أنجزها فريق العمل من جامعة محمد بن زايد للذكاء الاصطناعي تعد الأولى من نوعها التي تتناول موضوع التعرف على الأجسام في العالم المادي المفتوح لصور الأقمار الاصطناعية؛ هذا ويعتزم شولاكال ومولابيلي مواصلة جهودهما من خلال توسيع نطاق عملهما ليشمل تقنية الفيديو والعمل باستمرار على تقليل عدد التعليقات/الشروحات التوضيحية لتدريب نماذج الرؤية الحاسوبية.
وأكد شولاكال هذا قائلا: “سنواصل العمل على حل هذه المشكلة وتحسين الأداء، ونأمل أن نرى المزيد من الابتكارات في هذا المجال البحثي المهم من جميع أنحاء العالم”.
علماء من جامعة محمد بن زايد للذكاء الاصطناعي يطورون طريقة جديدة ستساعد الأطباء على توقع مسار تطور.....
تشاو تشين يوضح كيف أن إعادة تدريب نماذج أساسية باستخدام محولات مكنه من تحسين أدائها، وما قد.....
طريقة الجديدة لتعلم الآلة تستطيع تحليل السجلات الطبية الإلكترونية، وقد تساعد الأطباء في تحديد المرضى المعرضين لخطر.....