أعضاء من الهيئة التدريسية يحصدون جائزة الفرع الأوروبي لجمعية اللغويات الحاسوبية للعام 2023 - MBZUAI MBZUAI

أعضاء من الهيئة التدريسية يحصدون جائزة الفرع الأوروبي لجمعية اللغويات الحاسوبية للعام 2023

الخميس، 04 مايو 2023

حصد أستاذان من الهيئة التدريسية في جامعة محمد بن زايد للذكاء الاصطناعي، وهما ألهم فكري آجي وتيموثي بالدوين، إلى جانب المؤلفين المشاركين الآخرين، جائزة الورقة البحثية المتميزة من الفرع الأوروبي لجمعية اللغويات الحاسوبية للعام 2023. يُذكر أن آجي هو أستاذ مساعد في معالجة اللغات الطبيعية في جامعة محمد بن زايد للذكاء الاصطناعي، وأن بالدوين هو عميد الجامعة بالإنابة ورئيس قسم معالجة اللغات الطبيعية بالإنابة.

وقد تم تكريم آجي وبالدوين إلى جانب 12 مؤلفاً مشاركاً من بلومبرغ وجامعة هونغ كونغ للعلوم والتكنولوجيا، وجامعة إندونيسيا، والرابطة الإندونيسية للغويات الحاسوبية، وجامعة ملبورن، وجامعة تلكوم، وجامعة كاندا للدراسات الدولية، وشركة كاتا إيه آي، وجامعة زيورخ، والباحث العلمي من غوغل، على الورقة البحثية التي نُشرت تحت عنوان: “نوسا إكس: مجموعة بيانات مشاعر متعددة اللغات موازية لعشر لغات إندونيسية محلية.”

ولا بد من الإشارة إلى أنه تم الإعلان عن الجائزة في خلال مؤتمر الفرع الأوروبي لجمعية اللغويات الحاسوبية، والذي عُقد في 4 مايو 2023 في دوبروفنيك في كرواتيا.

بحث اللغات الإندونيسية

تشير بعض التقديرات إلى وجود أكثر من 7000 لغة حول العالم. إلا أن الجدير بالملاحظة أن إندونيسيا وحدها تضم حوالي 700 لغة، وأن كل منها يتحدثها أكثر من مليون شخص. ولكن لأسباب عدة، أبرزها غياب الدعم الرسمي للغالبية العظمى من هذه اللغات للأغراض الرسمية، فإن العديد من هذه اللغات أخذت تتلاشى أو باتت تصنف على أنها مهددة بالانقراض، لاسيما في التطبيقات الرقمية.

نتيجة لذلك، فإن العديد من المتحدثين بهذه اللغات غير قادرين على الوصول سوى بشكل محدود إلى محتوى عالي الجودة، وخدمات مصرفية، ومصادر تعليمية، وخدمات حكومية إلكترونية، وغير ذلك، بلغتهم الأم.

لذا، وبهدف الحفاظ على هذه اللغات، يحتاج الباحثون إلى موارد، مثل مجموعات البيانات المعيارية والمعاجم. في هذا السياق، طوّر أجي والمؤلفون الآخرون، في أحدث أبحاثهم، أول مورد موازٍ لعشر لغات إندونيسية منخفضة الموارد. ويهدف المورد الذي عملوا على إعداده إلى المساعدة في تعزيز الأداء في مجالات المهام، مثل تحليل المشاعر والترجمة الآلية.

تقدم الورقة البحثية تحليلاً شاملاً وتصف تحديات إنشاء مثل هذه الموارد. ويأمل المؤلفون أن يكون عملهم هذا مصدر إلهام للمزيد من الأبحاث في اللغات الإندونيسية على وجه التحديد، وفي اللغات ذات التمثيل الضعيف على نطاق أوسع.

لتنزيل البيانات من البحث، يُرجى زيارة:

https://huggingface.co/datasets/indonlp/NusaX-MT

و https://huggingface.co/datasets/indonlp/NusaX-senti

أخبار ذات صلة

thumbnail
الاثنين، 01 ديسمبر 2025

دور التعلّم التعزيزي في تحسين قدرة النماذج اللغوية على الاستدلال

دراسة حديثة صادرة عن "معهد النماذج التأسيسية" تكشف دور التعلّم التعزيزي في تحسين استدلال النماذج اللغوية عبر.....

  1. المؤتمرات ,
  2. neurips ,
  3. البحوث ,
  4. النماذج اللغوية الكبيرة ,
  5. معهد النماذج التأسيسية ,
  6. K2 Think ,
  7. الاستدلال ,
اقرأ المزيد
thumbnail
الخميس، 27 نوفمبر 2025

بين الصوت والصورة: الذكاء الاصطناعي يفتح آفاقاً جديدة للتعرّف على الطيور النادرة

باحثون يطوّرون نموذجًا متعدد الوسائط ومجموعة بيانات جديدة للتعرّف بدقة على أنواع الطيور باستخدام الصور والأصوات.

  1. النماذج اللغوية الكبيرة ,
  2. معالجة اللغة الطبيعية ,
  3. متعدد الوسائط ,
  4. البيئة ,
  5. الرصد ,
  6. الطيور ,
  7. الطبيعة ,
  8. EMNLP ,
  9. المؤتمرات ,
اقرأ المزيد
thumbnail
الأربعاء، 26 نوفمبر 2025

ورقة بحثية تقترح مقياساً لمعرفة عدد الأسئلة اللازمة لاختراق نموذج ذكاء اصطناعي

ورقة بحثية جديدة تكشف إطاراً رياضياً مبتكرا لقياس العلاقة بين تسريب البِتّات وعدد الأسئلة اللازمة لاختراق نظم.....

  1. أبحاث ,
  2. المؤتمرات ,
  3. neurips ,
  4. النماذج اللغوية الكبيرة ,
  5. أوراق بحثية ,
  6. الأسئلة ,
  7. اختراق الحماية ,
اقرأ المزيد