حصد أستاذان من الهيئة التدريسية في جامعة محمد بن زايد للذكاء الاصطناعي، وهما ألهم فكري آجي وتيموثي بالدوين، إلى جانب المؤلفين المشاركين الآخرين، جائزة الورقة البحثية المتميزة من الفرع الأوروبي لجمعية اللغويات الحاسوبية للعام 2023. يُذكر أن آجي هو أستاذ مساعد في معالجة اللغات الطبيعية في جامعة محمد بن زايد للذكاء الاصطناعي، وأن بالدوين هو عميد الجامعة بالإنابة ورئيس قسم معالجة اللغات الطبيعية بالإنابة.
وقد تم تكريم آجي وبالدوين إلى جانب 12 مؤلفاً مشاركاً من بلومبرغ وجامعة هونغ كونغ للعلوم والتكنولوجيا، وجامعة إندونيسيا، والرابطة الإندونيسية للغويات الحاسوبية، وجامعة ملبورن، وجامعة تلكوم، وجامعة كاندا للدراسات الدولية، وشركة كاتا إيه آي، وجامعة زيورخ، والباحث العلمي من غوغل، على الورقة البحثية التي نُشرت تحت عنوان: “نوسا إكس: مجموعة بيانات مشاعر متعددة اللغات موازية لعشر لغات إندونيسية محلية.”
ولا بد من الإشارة إلى أنه تم الإعلان عن الجائزة في خلال مؤتمر الفرع الأوروبي لجمعية اللغويات الحاسوبية، والذي عُقد في 4 مايو 2023 في دوبروفنيك في كرواتيا.
تشير بعض التقديرات إلى وجود أكثر من 7000 لغة حول العالم. إلا أن الجدير بالملاحظة أن إندونيسيا وحدها تضم حوالي 700 لغة، وأن كل منها يتحدثها أكثر من مليون شخص. ولكن لأسباب عدة، أبرزها غياب الدعم الرسمي للغالبية العظمى من هذه اللغات للأغراض الرسمية، فإن العديد من هذه اللغات أخذت تتلاشى أو باتت تصنف على أنها مهددة بالانقراض، لاسيما في التطبيقات الرقمية.
نتيجة لذلك، فإن العديد من المتحدثين بهذه اللغات غير قادرين على الوصول سوى بشكل محدود إلى محتوى عالي الجودة، وخدمات مصرفية، ومصادر تعليمية، وخدمات حكومية إلكترونية، وغير ذلك، بلغتهم الأم.
لذا، وبهدف الحفاظ على هذه اللغات، يحتاج الباحثون إلى موارد، مثل مجموعات البيانات المعيارية والمعاجم. في هذا السياق، طوّر أجي والمؤلفون الآخرون، في أحدث أبحاثهم، أول مورد موازٍ لعشر لغات إندونيسية منخفضة الموارد. ويهدف المورد الذي عملوا على إعداده إلى المساعدة في تعزيز الأداء في مجالات المهام، مثل تحليل المشاعر والترجمة الآلية.
تقدم الورقة البحثية تحليلاً شاملاً وتصف تحديات إنشاء مثل هذه الموارد. ويأمل المؤلفون أن يكون عملهم هذا مصدر إلهام للمزيد من الأبحاث في اللغات الإندونيسية على وجه التحديد، وفي اللغات ذات التمثيل الضعيف على نطاق أوسع.
لتنزيل البيانات من البحث، يُرجى زيارة:
يحتفي العالم في 18 ديسمبر من كل عام باليوم العالمي للغة الضاد في لفتَتٍ يقف فيها العالم.....
فريق بحثي من جامعة محمد بن زايد للذكاء الاصطناعي وجامعة موناش يبحث في مدى قدرة النماذج اللغوية.....
اقرأ المزيدفريق بحثي من جامعة محمد بن زايد للذكاء الاصطناعي يفوز بجائزة تقديرية عن دراسة بحثية تشجع الباحثين.....