يشكل تجميع الشبكات العصبية وسيلة فاعلة لتحسين الدقة غالباً ما تنجح في تحقيق أداء شبيه بأداء النماذج الفردية الأكبر حجماً. ويطرح هذا الواقع سؤالاً بديهياً وهو: إذا كان لدينا الخيار بين التجميع العميق وشبكة عصبية واحدة، علماً أن الدقة الناتجة عن كليهما هي نفسها، فأي من الاثنين سنختار؟ تشير البحوث الصادرة مؤخراً إلى أن التجميع العميق قد يقدم مزايا فريدة تتخطى مجرد القدرة التنبؤية، وتشمل قياس عدم اليقين والمتانة في تحول مجموعات البيانات. تسعى هذه الجلسة إلى إظهار القيود التي تحدّ من هذه المنافع المزعومة، لتبيّن أن الشبكة العصبية الواحدة (ولكن الأكبر حجماً) قادرة على محاكاة هذه المزايا. ونعرض أولاً كيف أن تنوع التجميع لا يساهم بشكلٍ مفيد في قياس عدم اليقين بالنسبة للبيانات خارج التوزيع، وذلك وفق جميع المقاييس، لا بل يرتبط ارتباطاً وثيقاً بتحسن نسبي في النموذج الواحد الأكبر حجماً. ونبيّن ثانياً أن أداء التجميع المتعلق بالبيانات خارج التوزيع يعتمد بشكلٍ كبير على أدائه داخل التوزيع، وبالتالي لا دليل على أي “متانة فعلية”. ففي حين يشكل التجميع العميق وسيلة عملية لتحسين القدرة التنبؤية وقياس عدم اليقين والمتانة، تُظهر النتائج التي توصلنا إليها أنه يمكن تحقيق هذه التحسينات من خلال نموذج واحد (أكبر حجماً).
كيلي بوكانن هي طالبة دكتوراه في معهد زوكرمان في جامعة كولومبيا يوجّه عملها ليام بانينسكي وجون كانينغهام. وتركز بحوثها على تعلم الآلة والرؤية الحاسوبية لأغراض علم الأعصاب الحاسوبي وعلم السلوك العصبي الحاسوبي. وهي عضو في الفريق المعني بالتعلم العميق الموثوق في "غوغل برين" وشـركة "أكس ذا مونشـوت فاكتوري". وحازت شهادتي بكالوريوس وماجستير (بتميز) في هندسة الكهرباء من جامعة كانساس.
واحدة من بين نقاط قوة تقنيةٍ مثل تكنولوجيا معالجة اللغة الطبيعية هي قدرتها على تنفيذ مهامَ تتسم.....
اقرأ المزيد