تتعلم نماذج تعلم الآلة عن طريق تحليل البيانات باستخدام خوارزميات تحسين مثل خوارزميات النسب المتدرجة (gradient descent) التي تقلل باستمرار من معدلات الأخطاء التي ترتكبها النماذج في مجموعة تدريب معينة. وتعتبر هذه عملية مهمة بالنظر إلى تزايد استخدام الإنسان لنماذج تعلم الآلة في مختلف مجالات أنشطته من تصميم الأدوية إلى المركبات ذاتية القيادة.
وتقترح دراسة حديثة قام بإعدادها باحثون في جامعة محمد بن زايد للذكاء الاصطناعي ومؤسسات أخرى طرقاً جديدة للتعامل مع مشاكل التحسين المعقدة في تعلم الآلة، خاصة منها تلك التي تعتريها قيود تبرز في ظروف مختلفة كثيرة.
يشار إلى أن الدراسة المذكورة، تم تقديمها خلال فعاليات المؤتمر الدولي الثاني عشر حول تمثيلات التعلّم في نسخته لهذا العام والتي عُقِدت مؤخراً في فيينا. وساهم في إعداد الدراسة كل من الأستاذين المساعِدَين في قسم تعلم الآلة في جامعة محمد بن زايد للذكاء الاصطناعي بن غو وهوان شيونغ إلى جانب شينجي يوان من “إسام”. ويعتمد هذا التحليل على بحث سابق لـ ويليام دِي فَازِيلْ، وهو طالب دكتوراه في تعلم الآلة متخرج من جامعة محمد بن زايد للذكاء الاصطناعي ومؤلف مشارك للدراسة.
التعلم من التجربة
يتحدث دِي فَازِيلْ عن اهتمامه بدراسة وتحسين نماذج تعلم الآلة في مجموعة متنوعة من البيئات المختلفة قائلاً: “إن قدرة الآلة على التعلم من خلال الخبرة بدلاً من القواعد الصارمة أمر رائع”.
بدأ اهتمام دِي فَازِيلْ بتعلم الآلة من خلال مبادرة أصبحت مشهورة الآن في أوساط العاملين في مجال الذكاء الاصطناعي، وهي قيام شركة “ديب مايند” للذكاء الاصطناعي، التي استحوذت عليها “جوجل” في وقت لاحق، بتطوير نماذج يمكنها ابتكار طرق فعالة للعب الألعاب على نظام ألعاب الفيديو “أتاري”. وفي بعض الحالات، تفوق أداء هذه النماذج على الأداء البشري.
أحد المفاهيم المهمة في تعلم الآلة هو التقارب، الذي يلعب دوراً في تحسين هذه الأنظمة، حيث يساعد في ضمان قدرة الخوارزمية على الوصول إلى حل عالي الجودة. ولكن هناك الكثير من الأمور المجهولة عند الشروع في بناء نموذج لتعلم الآلة بهدف معالجة مهمة معينة.
فاستخدام إعدادات غير مناسبة لخوارزمية التحسين في نموذج معين لتعلم الآلة ومجموعة البيانات الخاصة به قد يجعل النموذج لا يتعلم إلا القليل من البيانات أو لا يتعلم إلا بعد عدد هائل من الخطوات. يقول دِي فَازِيلْ في هذا الشأن: “في جميع نماذج تعلم الآلة، يجب أن نعرف كيف سيحدث التقارب في النموذج، وما إذا كان سيستغرق أسبوعاً أو شهراً أو مليون عام”.
في الدراسة المُقدمة في المؤتمر الدولي حول تمثيلات التعلّم، دمج الباحثون نهجين، وهما نهج التحسين من الدرجة الصفرية ونهج التعتيب الصلب، بهدف معالجة البيانات المحددة التي تنشأ في تعلم الآلة، وأطلقوا على النهج الجديد اسم “التحسين من الدرجة الصفرية باستخدام التعتيب الصلب”.
يمكن استخدام هذا النهج لمعالجة مشاكل التحسين في الحالات التي لا تتوفر فيها صيغ رياضية تصف الوظائف المستهدفة للنموذج، وهي طرق لقياس ما يحاول النموذج تحقيقه، حيث يجب أن يكون الحل متناثراً، بمعنى أن المستخدم يريد جعل العديد من القيم في النموذج صفراً. فالتناثر يساعد على تبسيط النماذج وتسهيل تفسيرها على الأشخاص.
أحد جوانب العمل الذي جذب دو فازلس إلى التحسين هو أنه يمثل نقطة التقاء بين الرياضيات والبرمجة. وهو يوضح ذلك بقوله: “في مجال تعلم الآلة، كثيراً ما تنجح بعض الطرق دون وجود تفسير واضح لذلك. نهجنا صارم لأنه يمكننا بناءً على بعض الافتراضات تقديم تنبؤات عملية حول كيفية تأثير التغييرات التي نجريها على الأداء، وإذا كانت البيانات لا تتطابق مع نظريتنا، فيمكننا وضع افتراضات أكثر واقعية.”
هذه الخوارزمية الجديدة المقترحة تساعد على تحسين سرعة التقارب، وهي طريقة قياس سرعة وصول النظام إلى حل، مع إمكانية تطبيقها على نطاق واسع من خلال التغلب على التحديات التي تواجهها كل من طريقة التحسين من الرتبة الصفرية وطريقة التحسين باستخدام حد معين.
وتقدم الدراسة أيضاً أفكاراً نظرية من خلال تحليل التقارب وتطبيقات عملية من خلال إظهار الفعالية في المهام الواقعية، مثل الهجمات المعادية في الصور بهدف إرباك تطبيقات اكتشاف الأشياء.
يحتفي العالم في 18 ديسمبر من كل عام باليوم العالمي للغة الضاد في لفتَتٍ يقف فيها العالم.....
Martin Takáč and Zangir Iklassov's 'self-guided exploration' significantly improves LLM performance in solving combinatorial problems.
اقرأ المزيدفريق بحثي من جامعة محمد بن زايد للذكاء الاصطناعي وجامعة موناش يبحث في مدى قدرة النماذج اللغوية.....
اقرأ المزيد