تقطير المعرفة وتحويل النماذج اللغوية الكبيرة إلى نماذج صديقة للبيئة - MBZUAI MBZUAI

تقطير المعرفة وتحويل النماذج اللغوية الكبيرة إلى نماذج صديقة للبيئة

الثلاثاء، 02 مايو 2023

[wps_image-right image=”https://staticcdn.mbzuai.ac.ae/mbzuaiwpprd01/2023/05/AstronautCities.jpeg” caption=” ” first-paragraph=”ظهرت النماذج اللغوية الكبيرة على الساحة العالمية مع إطلاق شركة ‘أوبن أيه آي’ للنموذج التوليدي مسبق التدريب (‘جي بي تي’) وإطلاق شركة جوجل للنموذج اللغوي للتطبيقات الحوارية، وغيرها من التقنيات. وتعمل هذه النماذج عبر جمع كمية هائلة جداً من البيانات، من كامل شبكة الإنترنت مثلاً، ومن ثم معالجتها باستخدام خوارزميات يعتمد عليها محرّك لصنع القرار يستطيع بالتالي تشغيل الواجهات والإجابة عن الأسئلة وابتكار محتوى عالي الجودة وغيرها الكثير من المهام. ” second-paragraph=” “]

وها إن هذه الأنظمة القوية تستحوذ على اهتمام الجمهور ومخيلته. غير أن تدريبها واستخدامها قد استهلك بالفعل كميات كبيرة من الكهرباء والمياه والأموال توازي مستوى استهلاك مدينة بأكملها. لذلك يعمل فريق من الباحثين من جامعة محمد بن زايد للذكاء الاصطناعي وجامعة كولومبيا البريطانية وجامعة موناش على الحد بشكلٍ كبير من كميات الكهرباء والمياه والأموال الضرورية لتدريب هذه النماذج واستخدامها، وذلك من خلال ضبط التعليمات وتقطير المعرفة، مع الحفاظ في الوقت نفسه على إمكانيات النماذج اللغوية الكبيرة. بالإضافة إلى ذلك، يسعى هذا الفريق إلى تحسين أمن هذه النماذج إلى حد كبير.

وردت تقارير إخبارية مؤخراً تفيد أن أمن البيانات وخصوصيتها في بعض المؤسسات رفيعة المستوى قد تعرض لخطر بسبب تحميل البيانات إلى نماذج لغوية كبيرة. تعاون الأستاذ المشارك في قسم معالجة اللغات الطبيعية ألهم فكري آجي والأستاذ المشارك الزائر في قسم معالجة اللغات الطبيعية محمد عبد المجيد مع مينغهاو وو وعبد الوحيد وشيو زانغ ضمن فريق واحد لتطوير LaMini-LM، وهي مجموعة من النماذج اللغوية. ويسعى الباحثون إلى استخدام هذه المجموعة في السناريوهات التي تندر فيها الموارد مثل حواسيب المستهلكين والأجهزة المحمولة. وقد يساهم هذا الابتكار في الحد من المخاطر الأمنية بشكلٍ شبه كلي، ما يسمح للمؤسسات بمختلف أحجامها بالاستفادة من قدرات النماذج اللغوية الكبيرة باستخدام شبكة المنزل أو أجهزتهم الشخصية بطريقة فاعلة نسبياً.

ويفسر آجي أن “LaMini-LM هي مجموعة من النماذج اللغوية الصغيرة والفاعلة التي تم تقطيرها من “شات جي بي تي” وتدريبها على مجموعة بيانات واسعة النطاق تشمل 2.58 مليون تعليمة.” ويضيف: “ننظر في نماذج لها بنى وأحجام مختلفة ونجري تقيماً دقيقاً لأدائها وفق مختلف معايير معالجة اللغات الطبيعية والتقييمات البشرية.”

ونجح الفريق في تطوير النماذج اللغوية LaMini من خلال تقطير المعرفة من “شات جي بي تي”، وهي عملية شبيهة بكيفية نقل المعلّم للمعرفة الواسعة التي يمتلكها إلى طلابه. فبادروا بطرح أسئلة على “شات جي بي تي” وتلقوا الإجابات ثم استخدموا هذه الأخيرة لتدريب نماذج LaMini. واستغرق تدريب نماذج LaMini الأصغر حجماً وقتاً أقل بكثير من النماذج المثيلة الأكبر حجماً لكنها سجلت أداءً شبيهاً بهذه الأخيرة. وبحسب الفريق، تستطيع المؤسسات تخصيص النماذج اللغوية LaMini بحسب حالات الاستخدام وبالتالي الحفاظ على أمن البيانات، بدلاً من السماح لموظفيها باستخدام النماذج اللغوية الكبيرة القائمة على السحابة لطرح الأسئلة وتوليد المحتوى.

نشر آجي وآخرون ورقتهم البحثية بعنوان: “النماذج اللغوية LaMini: مجموعة متنوعة من النماذج المقطرة من تعليمات واسعة النطاق.” لمعرفة المزيد حول بيانات الفريق والنماذج التي طورها ونتائج معالجة اللغات الطبيعية والتقييمات البشرية، يمكنكم زيارة الموقع التالي: https://mbzuai-nlp.github.io/LaMini/

وحرص آجي على التأكيد أن هذا الإصدار من LaMini-LM هو النسخة الأولى ولا يزال الفريق يعمل بنشاط على تحسين النموذج. ويشكل نموذج LaMini-LM جزءاً من مبادرة أوسع على مستوى الجامعة تجمع بين شركاء عالميين مختلفين وتسعى إلى خفض انبعاثات الكربون من النماذج اللغوية الكبيرة وتعزيز أمنها وإمكانيتها على التكيف، ويشكل بوت “فيكونا” خير مثال على ذلك.

أخبار ذات صلة

thumbnail
الخميس، 04 ديسمبر 2025

كيف تُفكّر النماذج اللغوية؟ إشارات داخلية جديدة تساعد في كشف هلوسة الذكاء الاصطناعي بدقة أعلى

نهج بحثي مبتكر يستفيد من الإشارات الداخلية في النماذج اللغوية لقياس عدم اليقين ورصد هلوسات الذكاء الاصطناعي.....

  1. EMNLP ,
  2. معالجة اللغة الطبيعية ,
  3. الكشف ,
  4. الهلوسات ,
اقرأ المزيد
thumbnail
الاثنين، 01 ديسمبر 2025

دور التعلّم التعزيزي في تحسين قدرة النماذج اللغوية على الاستدلال

دراسة حديثة صادرة عن "معهد النماذج التأسيسية" تكشف دور التعلّم التعزيزي في تحسين استدلال النماذج اللغوية عبر.....

  1. النماذج اللغوية الكبيرة ,
  2. البحوث ,
  3. neurips ,
  4. المؤتمرات ,
  5. معهد النماذج التأسيسية ,
  6. K2 Think ,
  7. الاستدلال ,
اقرأ المزيد
thumbnail
الخميس، 27 نوفمبر 2025

بين الصوت والصورة: الذكاء الاصطناعي يفتح آفاقاً جديدة للتعرّف على الطيور النادرة

باحثون يطوّرون نموذجًا متعدد الوسائط ومجموعة بيانات جديدة للتعرّف بدقة على أنواع الطيور باستخدام الصور والأصوات.

  1. الرصد ,
  2. الطبيعة ,
  3. الطيور ,
  4. البيئة ,
  5. متعدد الوسائط ,
  6. معالجة اللغة الطبيعية ,
  7. EMNLP ,
  8. النماذج اللغوية الكبيرة ,
  9. المؤتمرات ,
اقرأ المزيد