نحو نماذج لغوية كبيرة شاملة
عززت مؤخراً، جامعة محمد بن زايد للذكاء الاصطناعي، هيئتَها التدريسية بكفاءة أكاديمية جديدة راكمت خبرة قوية في مجال تطوير تطبيقات معالجة اللغة الطبيعية خلال فترة عملها الطويلة مع واحدةٍ من شركات التكنولوجيا العالمية، ويتعلق الأمر بالبروفيسور مونوجيت تشوْدُرِي أستاذ معالجة اللغة الطبيعية الذي عُيِّن حديثاً في الجامعة.
بدأ تشوْدُرِي مسيرته المهنية كباحث ما بعد الدكتوراه في “معهد أبحاث مايكروسوفت” بعد حصوله – بوقت قليل – على الدكتوراه في علوم الحاسوب من المعهد الهندي للتكنولوجيا – خراجبور. اعتقد البروفيسور، حينئذ، أن عمله كباحث في المعهد سيكون لفترة وجيزة وسرعان ما سيلتحق بالعمل في الأكاديميا، غير أن القدر شاء له أن يعمل لدى “مايكروسوفت” قرابة 15 عاماً.
وبعد غيابه عن الأكاديميا لأكثر من عقد من الزمن، قرر تشودري مؤخراً العودة إليها قَناعة منه أن “التطورات المتسارعة التي تعرفها تكنولوجيا معالجة اللغة الطبيعية بحاجة إلى المواكبة من خلال التركيز الكامل على البحث العلمي الصرف الذي لا توفر ظروفه المناسبة غير البيئة البحثية الجامعية”.
والملاحظ، فعلاً، أن تكنولوجيا معالجة اللغة الطبيعية قد حققت، في ظرف سنوات قليلة فقط، تقدماً سريعاً شد له انتباه المختصين والمهتمين.
عام 2023
التحق تشوْدُرِي عام 2022، بعد قضائه أكثر من 10 أعوام في “معهد أبحاث مايكروسوفت”، بفريق عمل “مشروع مايكروسوفت تورينغ”، وهي مبادرة للتعلم العميق هدفها تطوير نماذج ذكاء اصطناعي يمكن استخدامها مع مجموعة متنوعة من منتجات مايكروسوفت بما فيها: “وُورد”، و”أُوفِيس”، و”بَوَربُوينت”.
وبسبب التحولات العميقة التي عرفتها تكنولوجيا معالجة اللغة الطبيعية عام 2023، لم تدم فترة عمل تشوْدُرِي في “مشروع تورينغ” طويلاً. ويتذكر البروفيسور أن “كل شيء قد تغير فقط بعد نصف عام على انضمامي إلى ’تورينغ‘” بإطلاق “أوبن إي آي” لـ “جي بي تي 4″، الذي يعد – يقول تشوْدُرِي – أكثر نموذج لغوي كبير تقدماً تطلقه الشركة.
يشار إلى أن “مايكروسوفت” وقعت مع “أوبن إي آي” شراكة استراتيجية عام 2019 قادتها إلى استثمار مليار دولار (3,67 مليار درهم) على مدى سنوات في هذه الشركة الناشئة في سان فرانسيسكو. وقد مكنت هذه الشراكة البروفيسور من التعرف عن قرب على منتجات شركة “أوبن إي آي” واستخدام “جي بي تي 3” الذي أعجب تشوْدُرِي بقدرته على إنجاز مهام لم يتم تدريبه عليها، وهي ما يعرف بـ “التعلم دون أمثلة” (zero-shot) أو “التعلم بأمثلة قليلة” (few-shot).
إعجاب تشوْدُرِي بقدرات “جي بي تي 3” أصبح انبهاراً عندما عاين مع زملائه – قبل أشهر من إطلاقه – إصدار الجيل الرابع لتطبيقات النماذج اللغوية الكبيرة من شركة “أوبن إي آي”؛ ويقول: “أصابتنا حالة من الذهول جعلت ردت فعلنا حيال ’جي بي تي 4‘ الأولية هي عدم التصديق، حيث إن أداءه كان دائماً جيداً أو أفضل من أداء الإنسان بالنسبة لأي مهمة أمكننا اختباره بها”.
شَكَّلَ ما حققه تطبيق ’جي بي تي 4‘ تحولاً نوعياً في مجال برمجة النماذج اللغوية الكبيرة بالنسبة لـ تشوْدُرِي وزملائه في الوقت الذي اعتمدوا فيه في “مايكروسوفت” تطوير نماذج الذكاء الاصطناعي المسؤولة نهج البرمجة اليدوية لضمان تحييد خطر مشاركة أي محتوى ضار مع المستخدمين. ورغم ما تتطلبه البرمجة اليدوية من جهد وساعات تدريب للنموذج، فإن فعالية المقاربة تبقى جيدة.
المثير للاهتمام هو أن الاختبارات التي أخضع لها تشوْدُرِي وفريقه “جي بي تي 4” لمعرفة مدى قدرته على تحديد هذا المحتوى الضار في سياقات لم يُدَّرَب عليها بالمرة وأخرى دُرِّب عليها قليلاً، أظهرت نتائجها المفاجئة أن أداء التطبيق أتى مشابهاً لأداء الإنسان في تحديد المعلومات المقلقة.
والمذهل – يقول تشوْدُرِي – أن أداء “جي بي تي 4″، باستخدام حزمة بيانات المحتوى الضار، أتى متوافقاً في 90% من الحالات مع أداء الإنسان، وتفوق عليه في 5% من الحالات، فيما بقيت 5% من الحالات غامضة. ويضيف: “تفوق ’جي بي تي 4‘ كان واضحاً خلال هذه الاختبارات ولم نتخيل أن التكنولوجيا ستتطور بهذه السرعة إلى درجة تفوقها على الإنسان”.
بحاجة إلى مزيد من التطوير
رغم أن أداء “جي بي تي 4” بَدَا مذهلاً للوهلة الأولى، إلا أن الاختبارات الإضافية التي قام بها تشوْدُرِي أظهرت أنه ليس كذلك، حيث إن أداءه لم يكن بالقوة نفسها مع لغات أخرى غير الإنجليزية، وهذا يفتح الباب أمام فرص تطوير واعدة. وتجدر الإشارة إلى أن أداء “جي بي تي 4″، ونماذج لغوية كبيرة أخرى عديدة، يتسم بالضعف عند استخدام لغات أخرى غير تلك الأكثر انتشاراً في العالم.
ويعتقد تشوْدُرِي أن تعزيز قدرة تطبيقات معالجة اللغة الطبيعية باستخدام مجموعة أكبر من اللغات يمكن أن يكون له فوائد اقتصادية وثقافية كبيرة على الإنسانية جمعاء، غير أن تحقيق هذا سيتطلب القيام بتغييرات مهمة على مستوى منهجية تطوير النماذج اللغوية الكبيرة وكيفية تقييمها.
وللتوضيح فإن النماذج اللغوية الكبيرة تقوم خلال مرحلة تدريبها بمعالجة مجموعات ضخمة من النصوص والبيانات اللغوية التي تعتمد فيها على صفحات الإنترنت ومستودعات البيانات اللغوية، غير أن الإنترنت لا يعكس التنوع اللغوي في العالم الأمر الذي غالباً ما يؤثر على أداء هذه النماذج، حيث إنها تكون متفوقة في اللغات التي تتميز بوفرة البيانات، لكنها تواجه صعوبة في التعامل مع معظم لغات العالم التي يبلغ عددها حوالي 6 آلاف لغة.
وعلى سبيل المثال، يشير تشوْدُرِي إلى وجود ما يقرب من 130 مليون متحدث باليابانية، في حين أن اللغة الهندية يتحدث بها ما يقرب من 350 مليون شخص، غير أنه – نظراً لمجموعة من الاعتبارات التاريخية والاقتصادية – هناك العديد من الموارد التي يمكن استخدامها لتدريب النماذج اللغوية الكبيرة باليابانية أكثر من تلك الموجودة باللغة الهندية.
ويشرح البروفيسور هذا التحيز اللغوي في مقال نُشر له مؤخراً في مجلة Nature Human Behavior المحكمة قائلاً أن: “هيمنة البيانات من اللغات الأوروبية المستندة إلى الكتابة بالحروف اللاتينية والسيريلية (التي ينتمي معظمها إلى العائلة الهندية الأوروبية) قد أدت إلى تطوير نماذج لغوية كبيرة بقواعد نحوية ودلالية وإملائية تتسم بتحيزها القوي تجاه هذه اللغات”.
مشكلة أخرى جديرة بالاهتمام تتجلى في كون أن مطوري النماذج اللغوية الكبيرة عادة ما يقَيِّمون النماذج ويصنفونها وفقاً لمتوسط أدائها عبر اللغات. وتشجع هذه المنهجية المطورين على اتباع المسار الأسهل عند محاولة تحسين الأداء المتوسط، حيث يقومون بتعزيز قدرة النموذج اعتماداً على لغات تتوفر على موارد نصية ولغوية قوية مثل اللغة الإنجليزية ويتجاهلون اللغات الأخرى منخفضة الموارد.
ويرى تشوْدُرِي أنه في حال خصص المطورون بعضاً من جهدهم واستثمروه في العمل على لغات أخرى بدلاً من مواصلة تحسين القدرات التقنية وتسخيرها لخدمة لغات خبروها جيداً، فمن المرجح أنهم سيشهدون عائداً أكبر على جهودِهِم”.
مسؤولية الحفاظ على التنوع
من الطبيعي أن ينطوي أي تطور تكنولوجي على مخاطر، والأمر نفسه بالنسبة لمخاطر تطوير النماذج اللغوية الكبيرة التي يمكنها إعادة تشكيل الاقتصادات والثقافات، وعدم عمل الباحثين على تطوير نماذج تعكس التنوع اللغوي في العالم، قد يؤدي إلى ضياع ذلك الغنى والتنوع الذي تتمتع به البشرية.
ونلاحظ – يقول تشوْدُرِي – أن الأفراد يحاولون تعلم لغات جديدة بهدف الانتقال والاستقرار في بيئات ثقافية أخرى تتوفر فيها منافع اقتصادية”. ويضيف: “إذا لم نبذل جهداً واعياً لدعم عالمنا متعدد اللغات، فسنعيش في عام متجانس على كل المستويات وهذا الوضع سيعرض التنوع الكبير للمعرفة الذي راكمته الإنسانية إلى خطر الضياع”.
وعلى النحو الذي لا تمثل به النماذج اللغوية الكبيرة لغات العالم، فهي أيضاً لا تعكس تنوع الثقافات والقيم خارج المجتمع الغربي. وأوضح تشوْدُرِي – الذي سيركز اهتمامه البحثي في الجامعة على دراسة العلاقة الوثيقة بين اللغة والثقافة وكيفية تجليها في النماذج اللغوية الكبيرة – أن: “البنيات الثقافية والقيمية الاجتماعية هي هيكليات معقدة يصعب تحديدها، بل وأكثر من هذا يصعب الحصول على بيانات عنها”. ويضيف: “تطرح إمكانيات تسخير النماذج اللغوية الكبيرة لاحتواء ثقافات وقيم الجنوب العالمي تحديات فريدة متعددة التخصصات للمهندسين والباحثين ليس فقط في تخصص معالجة اللغة الطبيعية، ولكن أيضًا فرصة لعلماء الاجتماع وعلماء النفس والفلاسفة”.
ويتوقع تشوْدُرِي، على صعيد آخر، أن مستقبل معالجة اللغة الطبيعية سيمكن متحدثين بلغات أخرى عديدة حول العالم من الاستفادة من هذه التكنولوجيا، مؤكداً، في الوقت نفسه، أنه قد لا يكون – عملياً – ممكناً أن يتعامل مطورو النماذج اللغوية الكبيرة مع جميع اللغات البالغ عددها 6 آلاف على قدم المساواة؛ ويضيف أنه: “يمكننا بما هو متاح من بيانات توفير حلول هذه التقنية لحوالي ألفين إلى 3 آلاف لغة، وتحقيق هذا الهدف يرتبط بمدى استعدادنا الجماعي”.
يحتفي العالم في 18 ديسمبر من كل عام باليوم العالمي للغة الضاد في لفتَتٍ يقف فيها العالم.....
فريق بحثي من جامعة محمد بن زايد للذكاء الاصطناعي وجامعة موناش يبحث في مدى قدرة النماذج اللغوية.....
اقرأ المزيدفريق بحثي من جامعة محمد بن زايد للذكاء الاصطناعي يفوز بجائزة تقديرية عن دراسة بحثية تشجع الباحثين.....