قَبِل المؤتمر الدولي لتعلم الآلة السنوي في نسخته الأربعين حتى الآن 20 ورقة بحثية من إعداد 17 مؤلفاً مشاركاً من جامعة محمد بن زايد للذكاء الاصطناعي، وسيُعقد المؤتمر هذا العام في شهر يوليو في هونولولو في هاواي.
يبرز الأستاذ المشارك الزائر في قسم تعلم الآلة في الجامعة تونغليانغ ليو في طليعة المؤلفين، إذ قبل المؤتمر سبع أوراق شارك في تأليفها، يليه نائب رئيس قسم تعلم الآلة والأستاذ المشارك فيه ومدير مركز الذكاء الاصطناعي التكاملي كون زانغ الذي قُبلت له ست أوراق.
وحصل البروفيسور ليو على التقدير بفضل عمله المتعلق بنظم تعلم الآلة الموثوقة، وذكر معهد مهندسي الكهرباء والإلكترونيات اسمه ضمن قائمة أفضل عشرة باحثين واعدين في مجال الذكاء الاصطناعي.
أفاد مجتمع العلوم التابع للمعهد بما يلي عند الإعلان عن قائمة الباحثين: “لقد أدى عمله المتعلق بنظريات وخوارزميات تعلم الآلة باستخدام التسميات الصاخبة إلى مساهمات وتأثيرات كبيرة في مجالات تعلم الآلة والرؤية الحاسوبية ومعالجة اللغات الطبيعية والتنقيب في البيانات، لاسيما أن مجموعات البيانات واسعة النطاق في هذه المجالات هي عرضة لأخطاء بالغة في ما يخص التسميات.”
يمكن مشاهدة جلسة حوارية مع البروفيسور ليو حول الأسماء الصاخبة هنا:
تستلزم الشبكات العصبية العميقة كميات كبيرة من البيانات التي توفر فاعلية عالية عندما تتم تسميتها بشكلٍ صحيح. ولكن نادراً ما تكون هذه البيانات بمستوى الوضوح الذي يفضله علماء البيانات في العالم الحقيقي، ما يؤدي إلى خفض فاعلية أداء الشبكات. لقد طوّر الباحثون في هذا المجال خوارزميات متعددة لتعلم الآلة تُعنى بمعالجة التسميات الصاخبة. ويمكن تصنيف هذه التطورات ضمن قسمين: الطرق شبه الموجهة والطرق التي تسعى إلى نمذجة الصخب وتقليصه.
تسعى الورقة البحثية بعنوان: 'أيهما أفضل للتعلم بوجود التسميات الصاخبة: الطرق شبه الموجهة أو طرق نمذجة صخب التسميات؟' التي ألفها زانغ وآخرون إلى تحديد أي من الطرق هي الأنسب لتسمية مجموعات البيانات التي تُستخدم في الشبكات العصبية العميقة، الطرق القائمة على التعلم شبه الموجه أو الطرق القائمة على النماذج؟ وتُعتبر التسمية خطوة مهمة للشبكات العصبية العميقة لأنها تساهم في تدريب الشبكة على التعرف على الأنماط والتوصل إلى تنبؤات دقيقة. أما الهدف في الشبكات العصبية، فهو التعلم من مجموعة البيانات المدخلة والتوصل إلى تنبؤات مخرجة. وتشمل عملية التسمية تحديد تسميات للبيانات المدخلة باستخدام المعلومات التي ستعتمد عليها الشبكة للتعلم.
ويقول ليو في هذا الصدد: “يجب أن يتمكن الجميع من الوصول إلى تعلم الآلة وليس الأفراد الذين يستطيعون تكبد تكاليفه فحسب. ينتقل مجال تعلم الآلة المعاصر تحديداً إلى عصر من النماذج المعقّدة (مثل الشبكات العصبية العميقة) التي تستلزم كميات كبيرة من البيانات المُسماة بشكلٍ جيد. وفي حين أن الشركات الكبيرة تمتلك ما يكفي من الأموال لجمع البيانات المُسماة بشكلٍ جيد، بالكاد تستطيع الشركات الناشئة أو المنظمات غير الربحية الحصول على هذه البيانات بسبب ارتفاع تكلفة البيانات المُسماة.”
ساهم ثلاثة أعضاء من الهيئة التدريسية في جامعة محمد بن زايد للذكاء الاصطناعي في تأليف هذه الورقة البحثية وهم ليو وزانغ والأستاذ المشارك المنتسب في قسم تعلم الآلة مينمينغ غونغ، بالإضافة إلى الزميل في بحوث ما بعد الدكتوراه يو ياو.
ويبيّن الفريق من خلال هذا البحث أن الحل يعتمد على كيفية إنشاء البيانات. ففي حالة الطرق القائمة على التعلم شبه الموجه، تضطلع كيفية إنشاء البيانات بأهمية أساسية في حين أن لا تأثير لها في الطرق القائمة على النماذج. ويؤكد المؤلفون أنه يجب تصميم طريقة هجينه لنمذجة صخب البيانات وفي الوقت نفسه الاستفادة من التعلم شبه الموجه بهدف تحسين متانة النموذج بشكلٍ عام. علاوة على ذلك، يقترح الفريق طريقة اكتشاف هيكلية سببية للتعلم باستخدام التسميات الصاخبة، أو مُقدِّر متعلق بهذه الطريقة يكتشف كيفية إنشاء البيانات ويحدد متى تكون المعلومات ضرورية عند تصميم الطرق.
ويقول زانغ: “لتكون نظم الذكاء الاصطناعي موثوقة، على العديد منها التعامل مع الصخب الذي قد يحدث في خلال عملية التسمية البشرية لأن فهمنا يبقى غير مثالي كما أننا نفتقر إلى الوقت الكافي. وفي الآن عينه، يشكل التعلم شبه الموجه نموذجاً مُستخدماً على نطاق واسع في عمليات التعلم البشري. يهدف عملنا إلى إيجاد صلة الربط بين هذه العوامل والتوصل إلى وسائل محتملة تسمح لها بالاستفادة من بعضها.”
يحتفي العالم في 18 ديسمبر من كل عام باليوم العالمي للغة الضاد في لفتَتٍ يقف فيها العالم.....
فريق بحثي من جامعة محمد بن زايد للذكاء الاصطناعي وجامعة موناش يبحث في مدى قدرة النماذج اللغوية.....
اقرأ المزيدفريق بحثي من جامعة محمد بن زايد للذكاء الاصطناعي يفوز بجائزة تقديرية عن دراسة بحثية تشجع الباحثين.....