يعني التعلم التعزيزي تعلم كيفية اتخاذ قرارات متسلسلة عبر التفاعل مع البيئة. غير أن الأبعاد لطالما شكلت مشكلة كبيرة جدًا بالنسبة للتعلم التعزيزي المجدول التقليدي، ولذلك نادراً ما استُخدم هذا النوع من التعلم في التطبيقات المهمة. أما مؤخراً، فتم الجمع بين التعلم التعزيزي من جهة والتعلم العميق من جهة أخرى لابتكار التعلم التعزيزي العميق الذي يمكّن الباحثين من تخطي مشكلة الأبعاد والتوصل إلى نتائج مبهرة في مجموعة واسعة ومتنوعة من التطبيقات. وتشمل هذه التطبيقات تعلم كيفية لعب ألعاب الأتاري انطلاقاً من مدخلات البكسل الخام، وكيفية هزيمة كبار الخبراء في لعبة غو، وكيفية ضبط بلازما التوكاماك في الاندماج النووي، وتعلم خوارزميات فاعلة من الناحية الحاسوبية لمضاعفة المصفوفة. ومن التطبيقات الحديثة لهذه التقنية، تعلم كيفية جعل الإجابات في دردشة جي بي تي 3 أكثر دقة وشبيهة أكثر بإجابات البشر. أبدأ هذه الجلسة بمراجعة سريعة لبعض الإنجازات الكبيرة في مجال التعلم التعزيزي العميق لأنتقل بعد ذلك إلى مناقشة بحوثنا الخوارزمية المتعلقة بالتعلم التعزيزي العميق لفضاء البيئات والأفعال كثيرة الأبعاد، وكيفية تطبيقها في مجال تنقل الروبوتات.
البروفيسور كيث روس هو عميد قسم علوم الحاسوب وعلم البيانات والهندسة في جامعة نيويورك في شنغهاي. ويشغل أيضاً منصب أستاذ منتسب في قسمَي علوم الحاسوب في جامعة نيويورك في نيويورك. كما أنه شغل سابقاً منصب أستاذ في جامعة بنسلفانيا وفي معهد يورو كوم. وحاز شهادة دكتوراه من جامعة ميشيغان. والبروفيسور روس هو زميل في جمعية آلات الحوسبة وفي معهد مهندسي الكهرباء والإلكترونيات. وشارك في تأليف الكتاب المدرسي الشهير بعنوان "شبكات الحاسوب: مقاربة من الأعلى إلى الأسفل تشمل الإنترنت" الذي نشره دار بيرسون (النسخة الأولى عام 2000، النسخة الثامنة عام 2020)، وهو يُعتبر أكثر الكتب المدرسية شهرة في مجال شبكات الحاسوب على المستويين الوطني والدولي وقد تمت ترجمته إلى 14 لغة. بالإضافة إلى ذلك، شارك البروفيسور روس في تأسيس وقيادة شركة "ويمبا" في عام 1999، وهي شركة لتطوير تطبيقات الصوت والفيديو لخدمات التعليم عبر الإنترنت. وشغل منصب الرئيس التنفيذي ومدير التكنولوجيا التنفيذي في "ويمبا" بين عامَي 1999 و2001. تجدر الإشارة إلى أن شركة "بلاكبورد" استحوذت على "ويمبا" في عام 2010. أما اهتماماته البحثية الحالية، فتشمل التعلم التعزيزي العميق. وقد تتطرق عمله أيضاً إلى مواضيع الخصوصية عبر الإنترنت، وشبكات النظير للنظير، ونماذج وقياس شبكات الحاسوب. وتشمل المقررات التي يدرّسها في جامعة نيويورك في شنغهاي تعلم الآلة والتعلم التعزيزي ومقدمة إلى برمجة الحاسوب
واحدة من بين نقاط قوة تقنيةٍ مثل تكنولوجيا معالجة اللغة الطبيعية هي قدرتها على تنفيذ مهامَ تتسم.....
اقرأ المزيد