على الرغم من أنّ العربية هي اللغة الأم لأكثر من 400 مليون شخص، ما تزال النماذج اللغوية تواجه صعوبة في تحقيق أداء جيد على المقاييس التي تقيس فهم الثقافة العربية.
وتزداد المشكلة تعقيداً بسبب تنوّع العالم العربي نفسه؛ فرغم وجود أوجه تشابه ثقافية بين الدول الـ22 التي تعتمد العربية لغة رسمية، هناك أيضاً اختلافات بارزة تتعلق بالطعام والحياة الأسرية والعادات اليومية. وغالباً ما تختزل النماذج اللغوية هذه الفروق الدقيقة، إذ تميل إلى امتلاك فهم أعمق لثقافات الدول الأكبر حجماً، مثل مصر، مقارنةً بدول أصغر، مثل دولة الإمارات العربية المتحدة.
استكشف باحثون في جامعة محمد بن زايد للذكاء الاصطناعي نهجاً جديداً لمعالجة هذه التحديات، بهدف اختبار ما إذا كان يمكن استخدام المعرفة الثقافية لدولة معينة لتحسين فهم نموذج لغوي لدولة أخرى، في عملية يصفونها بـ”النقل العابر للثقافات في المعرفة المنطقية العامة”.
وباستخدام طريقتين مختلفتين للمواءمة — التعلم ضمن السياق، والتعلّم المُعزّز القائم على الأمثلة (DITTO) — تمكّن الباحثون من تحسين الأداء المتعلق بدول أخرى بنسبة بلغت 34% في إحدى الحالات، وبمتوسط 10% عبر النماذج متعددة اللغات. والمثير أنّ هذا التحسن تحقق عبر تزويد النماذج بنحو اثني عشر مثالاً توضيحياً فقط.
وقد عُرضت نتائج الفريق في مؤتمر 2025 حول الأساليب التجريبية في معالجة اللغات الطبيعية (EMNLP 2025) الذي أُقيم في مدينة سوتشو بالصين. ويضم مؤلفو الدراسة: سعيد المهيري، ورانيا حسام، ومينا عطية، وتشنشي وانغ، وبريسلاف ناكوف، وتيموثي بالدوين، وفجري كوتو.
يرتكز هذا النهج على مفهوم “التعلّم بالنقل”، حيث تُستخدم المعرفة المكتسبة من التدريب على مجموعة بيانات معينة لتحسين الأداء على مجموعة أخرى مختلفة. ويوضح سعيد المهيري، طالب الدكتوراه في الجامعة وأحد المشاركين في الدراسة “كنا نحاول القيام بشيء مماثل، ولكن بُعده ثقافي بحت”.

درس الباحثون كيف يمكن للأمثلة التوضيحية المرتبطة بثقافة ما أن تُحسّن قدرة النموذج على الإجابة عن أسئلة تتعلق بثقافة أخرى. ويبرز أحد الأمثلة كيف أدى التدريب على بيانات ثقافية عن مصر إلى تحسين الأداء في الإجابة عن أسئلة تخص دولة الإمارات.
ويضيف المهيري أنّ لديه اهتماماً شخصياً بتمثيل النماذج اللغوية للثقافة قائلاً: “رأيت نماذج تحاول تقليد اللهجة الإماراتية، ووجدت أنها غير دقيقة بدرجة كبيرة، لذلك أشعر بأن من مسؤوليتي الإسهام في هذا النوع من أبحاث معالجة اللغات الطبيعية المرتبطة بالثقافة”.
من جهتها، تشير رانيا حسام، طالبة الماجستير في معالجة اللغات الطبيعية وأحد المشاركين في الدراسة، إلى أنه رغم وجود أوجه تشابه بين مناطق العالم العربي، فإن من المهم تطوير نماذج تتوافق مع الخصوصيات الثقافية لكل دولة.
ويستند عمل المهيري وحسام إلى مشروع سابق لباحثين في الجامعة، وهو مجموعة معيارية للاستدلال الثقافي تُعرف باسم “ArabCulture” وتغطي هذه المجموعة 13 دولة ناطقة بالعربية و12 مجالاً من مجالات الحياة اليومية، مثل الأسرة والطعام والعادات والألعاب.
اختار الباحثون 24 مثالاً توضيحياً من مجموعة بيانات ArabCulture لكل دولة، مقسّمة إلى مجموعتين من 12 مثالاً: إحداهما تمثل مجال الطعام فقط، والأخرى تشمل مختلف مجالات الحياة اليومية. واستخدموا هذه الأمثلة لتعليم نموذجين لغويين متعددَي اللغات ونموذجين لغويين عربيين باستخدام التعلم ضمن السياق وطريقة DITTO . ثم اختبروا كل إعداد باستخدام مجموعات اختبار من دول أو مجالات مختلفة، بهدف معرفة ما إذا كانت مواءمة النموذج مع ثقافة دولة عربية معينة أو مجال معين ستعزز أداءه في الإجابة عن أسئلة تتعلق بدول أو مجالات أخرى.
وجد الباحثون أن التدريب على بيانات تخص دولة واحدة حسّن أداء النماذج في الإجابة عن أسئلة تتعلق بدول أخرى بنسبة تراوحت بين 2% و5% في مهام الاختيار من متعدد وإكمال الجمل، عبر مختلف النماذج وطرق المواءمة.
وأظهرت طريقة DITTO فعالية أكبر في تحسين أداء النماذج متعددة اللغات، بمتوسط تحسن بلغ 20% في أسئلة الاختيار من متعدد، في حين كان التعلم ضمن السياق أكثر فاعلية في مهام إكمال الجمل بمتوسط تحسن بلغ 6%.
ورغم أن النتائج تؤكد حدوث النقل العابر للثقافات، فإن بعض مجموعات الأمثلة من دول أو مجالات معينة كانت أكثر تأثيراً من غيرها. فعلى سبيل المثال، أدت الأمثلة المتعلقة بسوريا إلى أعلى متوسط تحسن بلغ 5.02% عبر جميع النماذج والطرق.
كما وجد الباحثون أن قابلية النقل تكون أكبر بين الدول المتشابهة ثقافياً، غير أن التشابه الثقافي لا يرتبط بالضرورة بالقرب الجغرافي. وفيما يتعلق بالمجالات الثقافية، أوضحت حسام أن الموضوعات شديدة التخصص، مثل الأمثال أو أطعمة معينة، لم تُظهر قابلية عالية للنقل.
كما سعى الباحثون إلى اختبار ما إذا كان استخدام أمثلة من ثقافات مختلفة تماماً سيؤثر في أداء النماذج على مهام الاستدلال الثقافي العربي فقاموا بمواءمة النماذج باستخدام أمثلة تتعلق بالثقافتين الإندونيسية والأمريكية.
والمفاجئ أنه على الرغم من الاختلاف الكبير بين هذه الثقافات، فإن التدريب على بيانات إندونيسية وأمريكية حسّن أداء النماذج في أسئلة الاختيار من متعدد المتعلقة بالثقافة العربية بنفس قدر التحسن الناتج عن التدريب على عينات عربية.
وبشكل عام، خلص الباحثون إلى أن النماذج تتحسن عبر النقل العابر للثقافات، وأن هذا النهج يمكن أن يساعد في تطوير فهم واسع للثقافة العربية، بدلاً من مجرد حفظ خصائص خاصة بدولة واحدة.
ويشير المهيري إلى أن هذا العمل يبرز إمكانات استخدام التعلّم بالنقل العابر للثقافات لتحسين مواءمة النماذج اللغوية ثقافياً، خاصة في الثقافات منخفضة الموارد. ومع ذلك، لا تزال هناك تساؤلات قائمة حول الأسباب التي تجعل هذا النهج فعّالاً إلى هذا الحد.
ويضيف: “ليست كل الثقافات متشابهة، حتى وإن كانت تستفيد من بيانات بعضها البعض. ينبغي أن نواصل دراسة كيفية تمثيل هذه النماذج للمعلومات المتعلقة بالثقافات المختلفة، وما الذي يجعل النقل العابر للثقافات ممكناً”.
مؤسسة غوغل توفر دعماً بقيمة مليون دولار أمريكي للبروفيسورة ثامار سولوريو لقيادة مبادرة بحثية تحويلية هدفها تطوير.....
لطالما استخدم صانعو الأفلام الذكاء الاصطناعي للتعبير عن آمال البشر ومخاوفهم، وطرح أسئلة جوهرية عن معنى الإنسانية.
ورشة عمل "الذكاء الاصطناعي من أجل الجنوب العالمي" تجمع أصواتاً متنوعة من مختلف القارات لصياغة ملامح التحديات.....