في عالم الذكاء الاصطناعي المليء بالمفاهيم والمصطلحات المتنوعة، يبرز مصطلح “النماذج اللغوية الكبيرة” كأحد أهم الركائز التي تُحدث نقلة نوعية في قدرة الآلة على التعامل مع لغة البشر.
ولكن ما هي النماذج اللغوية الكبيرة بالضبط وكيف تعمل؟ سنقدم فيما يلي شرحاً مبسطاً لأساسيات النماذج اللغوية الكبيرة ودورها المحوري في عالم الذكاء الاصطناعي.
ما هي النماذج اللغوية الكبيرة؟
النماذج اللغوية الكبيرة هي أنظمة ذكاء اصطناعي قوية يمكنها قراءة النصوص وفهمها وإنشائها بشكل يشبه أسلوب الإنسان. وتندرج في أحد فروع الذكاء الاصطناعي يُعرف باسم معالجة اللغة الطبيعية، وتُستخدم لأداء مهام مثل الكتابة والترجمة والإجابة عن الأسئلة، وذلك بعد تدريبها على كميات هائلة من البيانات النصية.
تشمل استخدامات النماذج اللغوية الكبيرة مجالات متعددة، مثل الدردشة الآلية، وإنتاج المحتوى، والترجمة، والتلخيص، وتعزيز الكفاءة في مهام أخرى. كما يمكنها المساعدة في البرمجة وإجراء الأبحاث وتوليد الأفكار وتنفيذ المشاريع الإبداعية.
ومن أبرز الأمثلة على النماذج اللغوية الكبيرة “GPT-4” من شركة “أوبن أيه آي”، و”LLaMa” من شركة “ميتا”، و”Gemini” من شركة “جوجل”، و“K2” من شركة “LLM360“، وغيرها الكثير. وبينما تركز هذه النماذج بشكل أساسي على اللغة الإنجليزية، فقد طوّرت جامعة محمد بن زايد للذكاء الاصطناعي مؤخراً نموذجاً لغوياً كبيراً خاصاً للغة العربية (جيس) ونموذجاً آخر خاصاً للغة الهندية (ناندا).
كيف تعمل النماذج اللغوية الكبيرة؟
تعمل النماذج اللغوية الكبيرة على معالجة النصوص وتوليدها بأسلوب يحاكي الفهم البشري. فعند إدخال نصّ ما في نموذج لغوي كبير، يقسمه إلى وحدات أصغر تسمى “العناصر اللغوية” (قد يكون العنصر اللغوي كلمة كاملة أو جزءاً من كلمة) ليتمكن من تحليل اللغة بكفاءة أكبر. ثم يستخدم بنية المحوِّل لفهم العلاقة بين هذه العناصر في سياق النص المُدخل.
لتنفيذ هذه المهام، تُدرَّب النماذج اللغوية الكبيرة على كميات هائلة من البيانات، مما يتيح لها تعلّم الأنماط والخصائص العامة للغة، وبحيث تتمكن من التنبؤ بالكلمة التالية (أو العنصر اللغوي التالي) في تسلسل معيّن. ويمكنها هذا من توليد نص مترابط ومناسب للسياق في الاستخدامات المتنوعة.
ما أنواع النماذج اللغوية الكبيرة؟
هناك أنواع متعددة من النماذج اللغوية الكبيرة، لكل منها أغراض معيّنة – فهناك مثلاً النماذج العامة مثل “ChatGPT” و”PaLM” و”LLaMa”، التي تُستخدم لإنجاز مجموعة واسعة من المهام. كما توجد نماذج خاصة لمهام محددة، مثل الترجمة أو التلخيص، حيث يجري ضبطها بدقة لأداء تلك المهام على وجه التحديد. أمّا النماذج متعدّدة الوسائط، فتجمع بين النصوص وأنواع أخرى من البيانات كالصوت أو الصور، ممّا يمنحها قدرات أكثر تنوّعاً وتقدّماً.
كما تنقسم النماذج اللغوية الكبيرة إلى نماذج مغلقة المصدر ونماذج مفتوحة المصدر. الفئة الأولى تطوّرها وتملكها وتسيطر عليها مؤسسات معيّنة تحتفظ بحقوق الوصول إلى منتجاتها، وغالباً ما يكون ذلك بهدف حماية الملكية الفكرية والسيطرة على استخدام النموذج. ولكن هذا النهج يفتقر إلى الشفافية ويثير أحياناً مخاوف تتعلق بالمساءلة والتحيّز.
أما النماذج مفتوحة المصدر، فتكون تعليماتها البرمجية وأوزانها [قيمها الرياضية أو العددية] وبياناتها متاحة للجميع، بحيث يمكن لأي شخص استخدامها وتعديلها. ويعزز هذا النهج الشفافية وإمكانية الوصول وفرص التعاون، ويتيح للباحثين والمطورين فهم آلية عمل النماذج والبناء عليها وتحسينها أو استخدامها في تطبيقات متنوعة.
كيف تُبنى النماذج اللغوية الكبيرة وكيف تُستخدم؟
تمر عملية بناء النماذج اللغوية الكبيرة واستخدامها بعدة مراحل أساسية: الأولى هي جمع البيانات وإعدادها، حيث يجري تحضير المعلومات التي سيتعلم منها النموذج. تلي ذلك مرحلة التدريب الأولي، حيث يجري إدخال البيانات إلى النموذج ليتعلّم منها البنى اللغوية وأنماطها. وبعد اكتمال التدريب، يجري ضبط النموذج بدقة لأداء مهام معينة أو لاستخدامه في مجالات محدّدة، وذلك باستخدام مجموعات بيانات خاصة بالمجال المعني. ثم يوضع النموذج قيد الاستخدام الفعلي في العالم الواقعي. وأخيراً، يخضع النموذج للمراقبة والتحديث بشكل مستمر لضمان المحافظة على دقته وقدرته على مواكبة المعلومات الجديدة أو التغيرات في اللغة.
ما هي الاعتبارات الأساسية عند بناء النماذج اللغوية الكبيرة واستخدامها؟
هناك أمور مهمّة ينبغي مراعاتها من منظور أخلاقي واجتماعي عند بناء النماذج اللغوية الكبيرة واستخدامها، وعلى رأسها الانحياز والعدالة والمعلومات الخاطئة، نظراً لقدرة هذه النماذج على التأثير على أفكار الناس وآرائهم وأفعالهم. لهذا السبب، تمثّل الشفافية والمساءلة عنصرين أساسيين لضمان إمكانية فهم وتتبع القرارات التي تتخذها النماذج اللغوية الكبيرة والاستنتاجات التي تخلص إليها. وهناك أيضاً مخاوف تتعلق باستهلاك الطاقة في هذه النماذج. وتُبذل حالياً جهود لتعزيز كفاءة استهلاك الطاقة عند بناء هذه النماذج وتدريبها وتشغيلها.
كيف يبدو مستقبل النماذج اللغوية الكبيرة؟
يبدو مستقبل النماذج اللغوية الكبيرة حافلاً بالفرص والتحديات، وعلى رأسها كفاءة الطاقة، حيث يبحث خبراء الذكاء الاصطناعي عن سبل لجعل هذه النماذج أكثر استدامة. كما يُتوقّع أن تظهر نماذج متخصّصة بشكل أكبر، سواء لخدمة قطاعات معينة أو لأداء مهام محددة، بما في ذلك زيادة التخصص في مجال اللغات. كما ستُدمج قدرات الوسائط المتعددة بشكل أكبر، مع تحسين قدرات الاستدلال وتقليص حالات الهلوسة (وهي الحالات التي تقدم فيها النماذج اللغوية الكبيرة معلومات خاطئة أو مضللة أو مُختلقة كلياً).
تسعى جامعة محمد بن زايد للذكاء الاصطناعي إلى جعل الذكاء الاصطناعي متاحاً للجميع من خلال تطوير نماذج لغوية كبيرة مفتوحة المصدر لتعزيز الشفافية والثقة والتعاون البحثي. ويتيح هذا النهج للباحثين والمطورين الوصول بشكل أكبر إلى النماذج وبيانات التدريب والتعليمات البرمجية ونقاط حفظ التدريب، ما يسمح بمزيد من الابتكار ويجعل التكنولوجيا المتقدمة متاحة لمن ليس لديهم الموارد اللازمة لتطوير نماذج خاصة بهم.
مسرد المصطلحات
النموذج اللغوي الكبير: نموذج ذكاء اصطناعي يُدرَّب على كميات ضخمة من البيانات لفهم لغة البشر وإنتاج نصوص تحاكي أسلوبهم.
النموذج اللغوي الكبير مفتوح المصدر: نموذج لغوي كبير تكون تعليماته البرمجية وأوزانه وبياناته متاحة للجميع، بحيث يمكن لأي شخص استخدامها وتعديلها.
التضمينات: تمثيلات رقمية للكلمات أو العناصر اللغوية تساعد النماذج على استيعاب المعاني والعلاقات الدلالية.
الضبط الدقيق: عملية ضبط أداء النموذج اللغوي الكبير بعد مرحلة التدريب الأولي، وذلك باستخدام مجموعة بيانات خاصة لتحسين أدائه لمهمة محددة.
المحولات التوليدية المدربة (GPTs): مجموعة من النماذج اللغوية الكبيرة جرى تدريبها على توليد نص مترابط ومتوافق مع السياق.
الهلوسات: حالات يُنتج فيها النموذج اللغوي الكبير معلومات غير دقيقة أو مختلقة، مع أنها تبدو مقنعة.
الاستدلال: عملية استخدام نموذج مدرَّب لإصدار تنبؤات أو إنتاج نص بناءً على البيانات المدخلة.
هندسة الأوامر: تصميم الأسئلة أو الأوامر بشكل مُحدد لتوجيه النموذج اللغوي الكبير إلى إنتاج المخرجات المطلوبة.
تقسيم النص إلى عناصره اللغوية: عملية تقسيم النص إلى وحدات أصغر (العناصر اللغوية) يسهل على النموذج معالجتها.
المحوِّلات: نوع من بنى الشبكات العصبية التي تستخدم آلية الانتباه الذاتي لمعالجة البيانات المتسلسلة، خاصة النصوص وتوليدها.
الانتباه الذاتي: آلية في بنية المحوِّلات تمكّن النموذج من تحديد أهمية الكلمات المختلفة في الجملة بغض النظر عن مكانها.
بينما تحتفل الإمارات بشهر الابتكار تحت شعار "الإمارات تبتكر 2025"، يحاول تيموثي بالدوين – عميد جامعة محمد.....
بعد نجاحه في تطوير أدوات مدعومة بالذكاء الاصطناعي تساعد في الكشف عن المعلومات المضللة والخاطئة، يركز زين.....
اقرأ المزيدانطلقت في أبوظبي، ولأول مرة في المنطقة، فعاليات واحدٍ من أبرز المؤتمرات العالمية في معالجة اللغة الطبيعية.....