منذ أطلقت شركة “أوبن أيه آي” نموذجها اللغوي الكبير “تشات جي بي تي” وما تبع ذلك من اهتمام كبير بالنماذج اللغوية الكبيرة، راح الناس يستكشفون كيفية استخدام هذه البرامج في مجموعة متنوعة من المهام التي تتجاوز مجرد إنشاء النصوص، بما في ذلك المهام التي تتطلب قدرة على حل المشاكل.
أعد فريق من الباحثين من جامعة محمد بن زايد للذكاء الاصطناعي وكينجز كوليدج لندن مؤخراً دراسة بحثية حول كيفية استخدام النماذج اللغوية الكبيرة لحل التحديات المعقدة المعروفة باسم المشاكل التوافقية، حيث طور الفريق استراتيجية جديدة لإعطاء الأوامر تسمى الاستكشاف الموجه ذاتياً ساعدت على تحسين أداء النماذج اللغوية الكبيرة بشكل كبير في هذه المهام. وستُعرض نتائج هذه الدراسة البحثية في المؤتمر السنوي الثامن والثلاثين لنظم معالجة المعلومات العصبية المُنعقد في فانكوفر.
ما هي المشاكل التوافقية؟
المشاكل التوافقية هي مشاكل يصعب حلها ويعكف العلماء على دراستها منذ عقود طويلة. ومن أمثلتها المعروفة مشكلة البائع المتجول الذي يحتاج لإيجاد أقصر طريق لجولته على عدد من المدن بحيث تنتهي تلك الجولة في المدينة التي انطلق منها. قد تبدو هذه مسألة بسيطة، ولكن تبين أن مجرد التوجه من مدينة معينة إلى أقرب مدينة تالية لا يؤدي إلى الحل الأمثل.
تثير مشكلة البائع المتجول وغيرها من المشاكل التوافقية اهتمام الباحثين لأنها معقدة حسابياً ولا يمكن حلها بسهولة عن طريق تجربة جميع الحلول الممكنة باستخدام قوة حسابية هائلة. على سبيل المثال، هناك 6 كوادريليون (الكوادريليون يساوي مليون مليار) حل محتمل لمشكلة البائع المتجول الذي يريد أن تشمل جولته 18 مدينة. لهذا السبب، لجأ العلماء إلى الإرشادات العامة التي تقوم على اتباع القواعد المتعارف عليها والطرق المختصرة لحل هذه المشاكل في ظل قيود معينة، حيث تساعد هذه الإرشادات على إيجاد الحل بشكل أسرع. وهنا يوضح زانغير إكلاسوف، وهو طالب دكتوراة في جامعة محمد بن زايد للذكاء الاصطناعي وأحد المشاركين في إعداد الدراسة البحثية، أن الطرق القائمة على الإرشادات العامة لا تقود بالضرورة إلى الحل الأمثل. ولضمان أعلى درجة من الفعالية، لا بد من تخصيص هذه الطرق وفقاً لتفاصيل كل حالة.
بينما تمثل المشاكل التوافقية مجالاً للبحوث النظرية لعلماء الرياضيات، فهي تبرز أيضاً في مجالات مثل العمليات اللوجستية والتخطيط وجدولة المهام. وتقدم “جوجل” حلاً للاستخدامات الصناعية اسمه Google-OR-Tools، ولكنه كما لاحظ إكلاسوف وزملاؤه في دراستهم ليس مفيداً للمشاكل الشديدة التعقيد. وبحث العلماء أيضاً عن طريقة لتدريب الشبكات العصبية من خلال التعلم المعزز لحل المشاكل التوافقية. ولكن الشبكات العصبية لم تتفوق في أدائها حتى الآن على الإرشادات العامة التقليدية. لذلك قد يكون للطرق الجديدة التي تستخدم النماذج اللغوية الكبيرة لحل المشاكل التوافقية تأثيرات عملية على مجموعة من الصناعات.
طريقة جديدة: الاستكشاف الموجه ذاتياً
إكلاسوف وزملاؤه هم أول من استخدم النماذج اللغوية الكبيرة لحل أنواع كثيرة ومختلفة من المشاكل التوافقية. هناك دراسات أخرى بحثت في كيفية استخدام استراتيجيات إعطاء الأوامر للنماذج اللغوية الكبيرة لحل مشكلة البائع المتجول. ولكن مع زيادة عدد المدن، لم تعد هذه الطرق تقدم نتائج كافية. كما أن الدراسات السابقة لم تتناول المشاكل التوافقية الإضافية، مثل طريق سير المركبة وجدولة الأعمال، التي تناولتها دراسة إكلاسوف وزملائه.
طبقت الدراسات السابقة طرق استكشاف الأفكار وتجزئة المشكلة والتحسين التدريجي لمساعدة النماذج اللغوية الكبيرة على تحليل المشاكل التوافقية خطوة بخطوة. أما طريقة الاستكشاف الموجه ذاتياً التي طورها إكلاسوف وزملاؤه، فهي تجمع بين الطرق الثلاث وتحقق أداءً أفضل من أداء كل منها على حدة بنسبة تقارب 28%. وتتسع هذه الفجوة مع زيادة صعوبة المشاكل. ويؤكد إكلاسوف في هذا السياق أنه “لا يوجد أبحاث كثيرة تناولت هذه المشاكل التوافقية العشوائية، لأنها معقدة جداً”.
تقترح طريقة الاستكشاف الموجه ذاتياً مسارات متعددة لتنفيذ كل مهمة. وتقسم المهام إلى مهام فرعية تحل كلاً منها لوحدها ثم تقدم الإجابة النهائية. وتتضمن هذه الطريقة خمس خطوات، وهي الاستكشاف، التجزئة، حل المهام الفرعية، الملاحظات والتحسين، الدمج. يقول إكلاسوف موضحاً: “نسأل النموذج اللغوي الكبير عن الإرشاد العام الذي يرى أنه الأفضل لحل مشكلة معينة. فيضع مساراً لكل مشكلة، ثم نطلب منه تقسيمها إلى مشاكل فرعية ومن ثم دمج الإجابات في الإجابة النهائية”.
اختبر الباحثون طريقة الاستكشاف الموجه ذاتياً على عدة نماذج لغوية كبيرة معروفة، وهي GPT-4 و GPT-3.5 من “أوبن أيه آي”، و Gemini-1.5 من “جوجل”، و LLaMA 2 من “ميتا”. وبينما حققت طريقة الاستكشاف الموجه ذاتياً أداءً أفضل في المشاكل التوافقية المختلفة، فقد كانت تكلفتها الحسابية أكبر، حيث تفوقت هذه الطريقة على طريقة تجزئة المشكلة بنسبة 27.84%، ولكنها تطلبت تنفيذ وظائف أكثر بنسبة 87.89%. لهذا السبب، يشير إكلاسوف وزملاؤه في الدراسة إلى أن طريقة الاستكشاف الموجه ذاتياً قد تكون مفيدة في الحالات التي يكون فيها للأداء أولوية على التكلفة.
مقارنة بين أداء طريقة الاستكشاف الموجه ذاتياً والطرق الأخرى لإعطاء الأوامر (استكشاف الأفكار، وتجزئة المشكلة، والتحسين التدريجي) عن طريق استخدام النموذجين GPT-4 من “أوبن أيه آي” و Gemini-1.5 من
“جوجل” لحل مشاكل توافقية متنوعة. وقد حققت طريقة الاستكشاف الموجه ذاتياً أداءً أفضل بكثير من أداء الطرق الأخرى عند استخدام النموذجين.
يشير إكلاسوف إلى نتائج الدراسة قائلاً: “وجدنا أن النماذج اللغوية الكبيرة يمكن أن تساعد في حل هذه المشاكل من خلال الجمع بين الحلول من الإرشادات المختلفة. ويمكننا جعل هذه العملية سريعة جداً باستخدام النماذج اللغوية الكبيرة لأنها تعرف أفضل الإرشادات العامة لحل مختلف أنواع المشاكل في الظروف المختلفة”.
ويضيف مارتن تاكاش، نائب رئيس قسم تعلم الآلة في جامعة محمد بن زايد للذكاء الاصطناعي، الذي شارك في إعداد الدراسة: “يبدو أن النماذج اللغوية الكبيرة قادرة على اختيار أفضل الإرشادات بشكل أسرع من الإنسان الذي يصعب عليه قراءة كل الأبحاث وتلخيصها وفهمها”.
ووجد الباحثون أيضاً أن طريقتهم تساعد في تحسين أداء النماذج اللغوية الكبيرة في مهام الاستدلال الأخرى.
الأثار العملية
تشير نتائج الدراسة إلى أن طريقة الاستكشاف الموجه ذاتياً تمكِّن النماذج اللغوية الكبيرة من حل المشاكل المعقدة، وبالتالي تزيد من إمكانية الاستفادة منها في قطاعات مثل العمليات اللوجستية وإدارة الموارد. ولكن تاكاش يؤكد أن حل هذه المشاكل أصعب على أرض الواقع بسبب وجود عوامل عشوائية تؤثر على الحل، مثل الازدحام المروري وسوء الأحوال الجوية.
تثير قدرة النماذج اللغوية الكبيرة على تقديم حلول لهذه المشاكل المعقدة تساؤلات حول قدرتها على التفكير. ويوضح تاكاش في هذا الشأن أنه حتى لو كانت النماذج اللغوية الكبيرة لا تفكر فعلياً عندما يُطلب منها حل هذه المشاكل، فهي تستخدم البيانات التي حفظتها أثناء التدريب لتقديم توصيات مفيدة بشأن الإرشادات الأفضل لحل مشاكل معينة. ويختتم كلامه بالقول: “إذا كنتَ تستخدم نموذجاً لغوياً كبيراً جيداً مثل GPT، فقد اطلعَ أثناء تدريبه على الكثير من المعلومات حول الإرشادات العامة، ولذلك يمكننا صياغة الأوامر التي نعطيها له للاستفادة من تلك المعلومات على النحو الأمثل”.
A team from MBZUAI created a fine-grained benchmark to analyze each step of the fact-checking process and.....
شياوجون شانغ، الأستاذ الزائر المتخصص في الرؤية الحاسوبية، ضمن قائمة أكثر الباحثين الذين تم الإشارة إلى بحوثهم.....
مي شعبان، طالبة الدكتوراة في قسم تعلم الآلة بجامعة محمد بن زايد للذكاء الاصطناعي، تعمل على تطوير.....