أرشيفات ثقافية خفية MBZUAI

نماذج الذكاء الاصطناعي… أرشيفات ثقافية خفية تعكس تفاصيل الحياة اليومية للمجتمعات

الأربعاء، 25 مارس 2026

في وقتٍ تُوصَف فيه النماذج اللغوية الحديثة تارة بأنها نظم للتنبؤ، وتارة أخرى كمحرّكات للاستدلال المنطقي أو مرايا إحصائية تعكس محتوى الإنترنت، تطرح دراسة علمية جديدة منظوراً مختلفاً وأكثر عمقاً مفاده أن هذه النماذج قد تمثّل أيضاً أرشيفات ثقافية تحفظ بين طياتها أنماط الحياة اليومية لمجتمعات متعددة، حتى وإن ظلّت هذه المعرفة كامنة في أعماقها وصعبة الاستخراج.

الدراسة، التي أعدّها باحثون من جامعة محمد بن زايد للذكاء الاصطناعي وجامعة دارمشتات التقنية، تسعى إلى إزاحة الستار عن هذا البُعد غير المرئي. ويقترح الباحثون منهجية لاستخلاص ما يُعرف بـ ” شبكات المعرفة البديهية” من النماذج اللغوية الكبيرة، وهي شبكات أو تمثيلات تربط بين الأفعال والتوقعات ضمن سياقات ثقافية محددة. ويركّز هذا النهجبدلاً من التعامل مع الثقافة كمجموعة من الحقائق المنفصلةعلى استعادة تسلسل الأحداث والسلوكيات التي تعكس كيفية سير الحياة اليومية في منظومات أو سياقات ثقافية معينة.

ويقول جونيور تونغا، الباحث في السنة الأولى من الدكتوراه في قسم معالجة اللغة الطبيعية والمؤلف الرئيسي للدراسة: “تنطلق فرضيتنا من طريقة تفكير الإنسان؛ إذ يعتمد الأفراد على معرفة ثقافية ضمنية تتيح لهم استنتاج ما هو أبعد مما يرونه مباشرة – ما الذي حدث في ما سبق، وما الذي قد يحدث في ما سيلحق، وكيف يمكن أن يشعر الآخرون”.

ويضيف: “نظراً لأن النماذج اللغوية تُدرَّب على نصوص راسخة في سياقات ثقافية، فإننا نفترض أنها قد تكتسب أنماطاً مشابهة من الاستدلال، ما يفتح المجال لفهمها ليس فقط كأدوات تنشئ النصوص، بل كأرشيفات ثقافية تحفظ تصورات ورؤى مشتركة حول الأسباب والنتائج ومسارات الأحداث”.

ومن المقرر أن يعرض الفريق البحثي نتائج هذه الدراسة خلال فعاليات “المؤتمر التاسع عشر للفرع الأوروبي لجمعية اللغويات الحاسوبية” (EACL 2026)، الذي تستضيفه العاصمة المغربية الرباط، بمشاركة فريق بحثي يضم جونيور سيدريك تونغا، وتشين سيسيليا ليو، وإيرينا غوريفيتش، وفجري كوتو.

وتؤكد الدراسة أن الثقافة لا تُختزل في معلومات متفرقة أو حقائق جامدة، بل تتجلّى في تسلسل الأفعال والإجراءات التي تشكّل نسيج الحياة اليومية؛ فإعداد وجبة إفطار في إندونيسيا أو الترتيب لحفل زفاف في مصر أو الاحتفال بمناسبة دينية في اليابان، لا تكتسب معناها من العناصر المستخدمة فحسب، بل من ترتيب الخطوات، والتوقعات الضمنية، والتبعات الاجتماعية المرتبطة بكل فعل.

في ضوء ذلك، تفتح هذه المقاربة آفاقاً جديدة لفهم أعمق لدور الذكاء الاصطناعي في توثيق التجربة الإنسانية، ليس فقط عبر الكلمات، بل من خلال الأنماط والسياقات التي تعكس روح المجتمعات وتحوّلاتها.

من بناء المعرفة الثقافية إلى تحسين أداء النماذج

لسبر أغوار هذه الأبعاد الدقيقة، اعتمد الفريق البحثي على أحد نماذج الذكاء الاصطناعي التي طرتها شركة OpenAI لتوليد افتراضات شرطية منظّمة بصيغة “إذا – فإن”، ثم توسيعها إلى مسارات متعددة الخطوات. وتقوم هذه المسارات بربط الأفعال عبر علاقات سببية وسياقية، مثل ما يُرجَّح أن يفعله الفرد لاحقاً أو ما يتعين عليه القيام به مسبقاً أو التأثيرات المحتملة لسلوكه على الآخرين. والنتيجة هي بناء شبكة معرفية تعكس ما يُعرف بـ “المعرفة الثقافية البديهية”، والتي تتجاوز في عمقها مجرد تجميع معلوماتي سطحي إلى تقديم إطار أكثر ثراءً لفهم التسلسل والسياق.

وقد قام الباحثون باختبار هذه المقاربة في خمس دول تمثّل تنوعاً ثقافياً ولغوياً شملت كل من: الصين، وإندونيسيا، واليابان، وإنجلترا، ومصر. وقد جرى بناء هذه الشبكات المعرفية باللغتين الإنجليزية واللغات المحلية لكل دولة، قبل عرضها على مقيّمين من الناطقين الأصليين للحكم على دقتها، ومدى ارتباطها بالسياق الثقافي، وتماسكها المنطقي.

وهنا تبرز إحدى أكثر النتائج هذه الدراسة إثارة للاهتمام؛ فخلافاً للاعتقاد السائد بأن تمثيل الثقافة يكون أكثر دقة بلغتها الأم، تكشف الدراسة عن صورة أكثر تعقيداً. إذ أظهرت الشبكات البيانية المبنية باللغات المحلية قدرة أعلى على الحفاظ على التفاصيل الدقيقة الخاصة بكل مجتمع، في حين جاءت المسارات المُنتجة باللغة الإنجليزية أكثر وضوحاً وتماسكاً من حيث البناء المنطقي. وبعبارة أخرى، قد تمتلك النماذج معرفة بثقافة معينة، لكنها تميل إلى التعبير عنها بصورة أكثر انتظاماً وموثوقية عند استخدام اللغة الإنجليزية مقارنة بلغات مثل العربية أو الصينية أو اليابانية أو الإندونيسية.

ولا يقتصر هذا الاكتشاف على كونه ملاحظة تقنية، بل يحمل دلالات ثقافية أعمق؛ إذ يشير إلى أن النماذج متعددة اللغات ما تزال تنظّم جزءاً كبيراً من تمثيلها المعرفي للعالم عبر طبقة مركزية متمحورة حول اللغة الإنجليزية. وهذا يعني أنها، رغم استيعابها لثقافات متعددة، فإنها لا تعكسها بالقدر ذاته من التوازن أو الدقة.

وانتقل الباحثون بعد ذلك إلى تساؤل عملي فكرته تسعى إلى الإجابة على سؤال: “أليس بإمكان هذه المعرفة الثقافية المنظمة أن تعزّز أداء النماذج اللغوية الأصغر حجماً؟ وقد جاءت النتائج في هذا الصدد مشجعة إلى حدٍّ كبير؛ ففي اختبارين معياريين يركز أحدهما على العالم العربي والآخر على إندونيسيا، ساهم إدراج هذه المسارات أو الافتراضات المستخرجة في تحسين الأداء، لا سيما بالنسبة للنماذج الأساسية أو محدودة القدرات التي تفتقر إلى مخزون ثقافي واسع. وقد كان أثر التحسينات أكثر وضوحاً عندما أُضيف السياق باللغة المحلية في مهام الإجابة عن الأسئلة. كما أسهمت إضافة المسارات متعددة الخطوات في جعل النصوص المُولّدة – مثل القصص – أكثر ارتباطاً بالمنظومة الثقافية وأكثر تماسكاً من الناحية السردية.

ومع هذا، لا تعني هذه النتائج أن المنهجية المقترحة قادرة على تحويل النماذج الضعيفة إلى أنظمة متمكّنة ثقافياً بشكل كامل. فالتحسينات، رغم أهميتها، تظل ضمن حدود واقعية. ففي بعض الحالات، لم تُظهر النماذج الأكبر والمُدرّبة بتوجيهات مسبقة مكاسب تُذكر، وهو أمر منطقي نظراً لامتلاكها بالفعل قاعدة معرفية أوسع. كما تشير الدراسة إلى أن أسلوب “التفكير المتسلسل”(Chain-of-Thought)  غالباً ما يؤثر سلباً على الأداء في هذا النوع من المهام، ما يعزّز الفرضية القائلة إن الفهم الثقافي يعتمد بدرجة أكبر على المعرفة البديهية والسياقية، لا على التحليل المنطقي المتدرّج.

بين القيمة والمخاطر

يؤكد جونيور تونغا وزملاؤه أن ما توصلوا إليه ما يزال في إطار النموذج البحثي الأولي، وليس قاعدة بيانات ثقافية جاهزة للاستخدام العملي. ويحذّر الباحثون صراحةً من أن المحتوى المستخرج من النماذج اللغوية قد يعيد إنتاج الصور النمطية أو يعكس تشوّهات معرفية راسخة في البيانات التي دُرّبت عليها هذه الأنظمة. ويُشكل هذا التحفّظ عنصراً جوهرياً في فهم طبيعة هذه النماذج؛ فإذا كانت تمثّل بالفعل أرشيفات ثقافية، فهي أرشيفات غير متوازنة، تتأثر بهيمنة لغات معينة، وبالتحيّزات الكامنة في فضاء الإنترنت، وباختلال توزيع البيانات.

ورغم هذه القيود، تبرز أهمية هذا التوجّه البحثي بوضوح. إذ تقدّم الدراسة إطاراً عملياً جديداً لاستكشاف ما تختزنه النماذج اللغوية من معرفة ثقافية، بعيداً عن الأساليب التقليدية التي تعتمد على استبيانات جاهزة أو مجموعات معلومات ثابتة. كما تفتح الباب أمام تصور أكثر نضجاً للذكاء الاصطناعي متعدد اللغات؛ تصور لا يكتفي بقدرة الأنظمة على التحدث بلغات متعددة، بل يقيس كفاءتها بمدى قدرتها على فهم المنطق الاجتماعي الخاص بكل ثقافة، دون اختزاله في قوالب عامة متمركزة حول اللغة الإنجليزية.

ولا شك أن تحقيق هذا الهدف ما يزال بعيد المنال، غير أن الدراسة تطرح رؤية مقنعة لمسار التقدم، قائم على بناء هياكل معرفية أكثر تنظيماً، وإخضاع النماذج لمستويات أعلى من التدقيق، وفهم أعمق للكيفية التي تُشفَّر بها الثقافة داخل ما يُعرف بفضاء التمثيل في هذه الأنظمة التي نُطلق عليها وصف “عامة”.

وفي هذا السياق، يشير تونغا، إلى جانب مشرفه الأكاديمي البروفيسور فجري كوتو، إلى أن النتائج تُظهر أن النماذج اللغوية الكبيرة تحتوي بالفعل على معرفة ثقافية ضمنية يمكن استخراجها في صورة منظمة – غير أن السؤال المحوري الذي ما يزال مفتوحاً يتمثل في كيفية ترميز هذه المعرفة داخل البنية الداخلية للنموذج، وكيف يمكن تطوير منهجيات أكثر فاعلية لاستثمارها، بما يتيح إنتاج استجابات أكثر ارتباطًا بالسياق الثقافي وأكثر وعياً وإدراكاً بتعقيداته.

أخبار ذات صلة

thumbnail
الخميس، 26 مارس 2026

بناء نموذج ذكاء اصطناعي يتحدث الهندية

تُظهر نماذج ناندا (Nanda) التي طوّرتها جامعة محمد بن زايد للذكاء الاصطناعي للغتين الهندية والإنجليزية أن فعالية.....

  1. الثقافة ,
  2. IFM ,
  3. معهد النماذج التأسيسية ,
  4. Nanda ,
  5. الهندية ,
  6. اللغة ,
  7. معالجة اللغات الطبيعية ,
  8. nlp ,
اقرأ المزيد