التدريب العدائي: التحسينات والتطبيقات

Thursday, September 01, 2022

في حين تحقق نماذج تعلم الآلة اليوم مستويات من الدقة تناسب التطبيقات في العالم الحقيقي، من الأساسي جداً أن ندرك أن هذه الدقة ليست المعيار الوحيد المهم الذي يجب اعتباره. لا بل على المطورين أن يعدوا نماذج تعلم الآلة بشكلٍ نشط لتكون متينة بما يكفي لحمايتها من محاولات اختراقها على أرض الواقع. ولكن لا تتمتع نماذج تعلم الآلة الناتجة عن التدريب القياسي بالقدرة على التعامل مع البيانات العدائية التي تولدها الهجمات العدائية بواسطة الخوارزميات. والهجمات العدائية هي خوارزميات تطبق اختلالات صغيرة مصممة خصيصاً على البيانات الطبيعية بهدف تحويلها إلى بيانات عدائية تضلل النموذج المدرب وتحمله على تقديم تنبؤات خاطئة. وترمي المتانة في وجه الهجمات العدائية إلى تحسين الدقة المتينة لنماذج تعلم الآلة تجاه البيانات العدائية، وهو أمر يمكن تحقيقه من خلال التدريب العدائي. وعلى وجه التحديد، يسعى التدريب العدائي إلى تحقيق غرضين هما: (1) تصنيف البيانات بشكلٍ صحيح (تماماً مثل التدريب القياسي) و(2) التأكد من عدم اقتراب أي بيانات من حدود القرار (على خلاف التدريب القياسي). وعند ظهور احتمال بأن تكون بيانات الاختبار عدائية، يحاكي التدريب العدائي بعناية بعض الهجمات العدائية أثناء التدريب. وهذا يعني أن النموذج سبق أن رأى بيانات اختبار عدائية متعددة بهدف تعميمها على بيانات الاختبار العدائية على أرض الواقع. وسأعرض في هذه الجلسة التحسينات الثلاثة للتدريب العدائي بالإضافة إلى دراستَي حالة حول الاستفادة من الهجوم/التدريب العدائي لتحسين/تقييم موثوقية الطرق القائمة على تعلم الآلة.

المتحدث/المتحدثين

في حين تحقق نماذج تعلم الآلة اليوم مستويات من الدقة تناسب التطبيقات في العالم الحقيقي، من الأساسي جداً أن ندرك أن هذه الدقة ليست المعيار الوحيد المهم الذي يجب اعتباره. لا بل على المطورين أن يعدوا نماذج تعلم الآلة بشكلٍ نشط لتكون متينة بما يكفي لحمايتها من محاولات اختراقها على أرض الواقع. ولكن لا تتمتع نماذج تعلم الآلة الناتجة عن التدريب القياسي بالقدرة على التعامل مع البيانات العدائية التي تولدها الهجمات العدائية بواسطة الخوارزميات. والهجمات العدائية هي خوارزميات تطبق اختلالات صغيرة مصممة خصيصاً على البيانات الطبيعية بهدف تحويلها إلى بيانات عدائية تضلل النموذج المدرب وتحمله على تقديم تنبؤات خاطئة. وترمي المتانة في وجه الهجمات العدائية إلى تحسين الدقة المتينة لنماذج تعلم الآلة تجاه البيانات العدائية، وهو أمر يمكن تحقيقه من خلال التدريب العدائي. وعلى وجه التحديد، يسعى التدريب العدائي إلى تحقيق غرضين هما: (1) تصنيف البيانات بشكلٍ صحيح (تماماً مثل التدريب القياسي) و(2) التأكد من عدم اقتراب أي بيانات من حدود القرار (على خلاف التدريب القياسي). وعند ظهور احتمال بأن تكون بيانات الاختبار عدائية، يحاكي التدريب العدائي بعناية بعض الهجمات العدائية أثناء التدريب. وهذا يعني أن النموذج سبق أن رأى بيانات اختبار عدائية متعددة بهدف تعميمها على بيانات الاختبار العدائية على أرض الواقع. وسأعرض في هذه الجلسة التحسينات الثلاثة للتدريب العدائي بالإضافة إلى دراستَي حالة حول الاستفادة من الهجوم/التدريب العدائي لتحسين/تقييم موثوقية الطرق القائمة على تعلم الآلة.

أخبار ذات صلة