أعضاء من الهيئة التدريسية يحصدون جائزة الفرع الأوروبي لجمعية اللغويات الحاسوبية للعام 2023

Thursday, May 04, 2023

حصد أستاذان من الهيئة التدريسية في جامعة محمد بن زايد للذكاء الاصطناعي، وهما ألهم فكري آجي وتيموثي بالدوين، إلى جانب المؤلفين المشاركين الآخرين، جائزة الورقة البحثية المتميزة من الفرع الأوروبي لجمعية اللغويات الحاسوبية للعام 2023. يُذكر أن آجي هو أستاذ مساعد في معالجة اللغات الطبيعية في جامعة محمد بن زايد للذكاء الاصطناعي، وأن بالدوين هو عميد الجامعة بالإنابة ورئيس قسم معالجة اللغات الطبيعية بالإنابة.

وقد تم تكريم آجي وبالدوين إلى جانب 12 مؤلفاً مشاركاً من بلومبرغ وجامعة هونغ كونغ للعلوم والتكنولوجيا، وجامعة إندونيسيا، والرابطة الإندونيسية للغويات الحاسوبية، وجامعة ملبورن، وجامعة تلكوم، وجامعة كاندا للدراسات الدولية، وشركة كاتا إيه آي، وجامعة زيورخ، والباحث العلمي من غوغل، على الورقة البحثية التي نُشرت تحت عنوان: “نوسا إكس: مجموعة بيانات مشاعر متعددة اللغات موازية لعشر لغات إندونيسية محلية.”

ولا بد من الإشارة إلى أنه تم الإعلان عن الجائزة في خلال مؤتمر الفرع الأوروبي لجمعية اللغويات الحاسوبية، والذي عُقد في 4 مايو 2023 في دوبروفنيك في كرواتيا.

بحث اللغات الإندونيسية

تشير بعض التقديرات إلى وجود أكثر من 7000 لغة حول العالم. إلا أن الجدير بالملاحظة أن إندونيسيا وحدها تضم حوالي 700 لغة، وأن كل منها يتحدثها أكثر من مليون شخص. ولكن لأسباب عدة، أبرزها غياب الدعم الرسمي للغالبية العظمى من هذه اللغات للأغراض الرسمية، فإن العديد من هذه اللغات أخذت تتلاشى أو باتت تصنف على أنها مهددة بالانقراض، لاسيما في التطبيقات الرقمية.

نتيجة لذلك، فإن العديد من المتحدثين بهذه اللغات غير قادرين على الوصول سوى بشكل محدود إلى محتوى عالي الجودة، وخدمات مصرفية، ومصادر تعليمية، وخدمات حكومية إلكترونية، وغير ذلك، بلغتهم الأم.

لذا، وبهدف الحفاظ على هذه اللغات، يحتاج الباحثون إلى موارد، مثل مجموعات البيانات المعيارية والمعاجم. في هذا السياق، طوّر أجي والمؤلفون الآخرون، في أحدث أبحاثهم، أول مورد موازٍ لعشر لغات إندونيسية منخفضة الموارد. ويهدف المورد الذي عملوا على إعداده إلى المساعدة في تعزيز الأداء في مجالات المهام، مثل تحليل المشاعر والترجمة الآلية.

تقدم الورقة البحثية تحليلاً شاملاً وتصف تحديات إنشاء مثل هذه الموارد. ويأمل المؤلفون أن يكون عملهم هذا مصدر إلهام للمزيد من الأبحاث في اللغات الإندونيسية على وجه التحديد، وفي اللغات ذات التمثيل الضعيف على نطاق أوسع.

لتنزيل البيانات من البحث، يُرجى زيارة:

https://huggingface.co/datasets/indonlp/NusaX-MT

و https://huggingface.co/datasets/indonlp/NusaX-senti

أخبار ذات صلة

thumbnail
Tuesday, November 26, 2024

النماذج اللغوية الكبيرة وفهم انفعالات الإنسان وعواطفه

فريق بحثي من جامعة محمد بن زايد للذكاء الاصطناعي وجامعة موناش يبحث في مدى قدرة النماذج اللغوية.....

  1. البحوث ,
  2. النماذج اللغوية الكبيرة ,
  3. EMNLP ,
  4. معالجة اللغة الطبيعية ,
  5. انفعالات الإنسان ,
  6. التعاطف ,
اقرأ المزيد