يشكل تصنيف النصوص مجالاً متطوراً يتم استخدامه بنجاح في تطبيقات عدة. غير أننا ما زلنا نحتاج بعض الشيء إلى أدوات تحل مشاكل المستخدمين بشكلٍ سهل وملائم. وطوّرنا مؤخراً أداة LibMultiLabel لتصنيف النصوص ثنائية/متعددة الأصناف ومتعددة التسميات، وهي أداة تدعم الخدمات الشاملة ابتداءً من النصوص الأولية وصولاً إلى التقييم/التحليل النهائي. وقد تم تضمين تقنيات التعلم الشائعة والانتقاء السهل لمُعامِل الضغط أيضاً. ولكن مع الأسف، ونظراً لعدد من اعتبارات التطبيق العملي (مثل انتقاء معايير التقييم، واستراتيجيات البيانات مع/بدون الأسماء المتعددة، إلخ.)، لم نجد بعد طريقة مناسبة لتوجيه المستخدمين ليجدوا حلاً فاعلاً لمشاكلهم. ولقد وجدنا خلال عملنا المستمر لتحقيق هذا الهدف أن الاستخدام غير المناسب لطرق تعلم الآلة يشكل مصدر قلق كبيراً الآن. وسنشارك معكم بعض القصص المثيرة للاهتمام ونناقش أهمية مساعدة المستخدمين على استخدام تقنيات تعلم الآلة بالشكل المناسب.
يشغل سي-جين لين حالياً منصب أستاذ متميز في قسم علوم الحاسوب في جامعة تايوان الوطنية. وحاز شهادة البكالوريوس من جامعة تايوان الوطنية في عام 1993 ثم شهادة الدكتوراه من جامعة ميشيغان في الولايات المتحدة عام 1998. وتشمل اهتماماته البحثية الرئيسية مجالات تعلم الآلة والتنقيب في البيانات والتحسين العددي. وقد اشتهر بفضل عمله على آلات المُتَّجهات الداعمة لتصنيف البيانات. ويشكل برنامج LIBSVM (وهو مكتبة لآلات المُتَّجهات الداعمة) الذي طوره إحدى أكثر حزم آلات المُتَّجهات الداعمة استخداماً واقتباساً. وحاز عمله البحثي جوائز متعددة، منها جائزة أفضل ورقة بحثية في أهم المؤتمرات المتعلقة بعلوم الحاسوب. وهو يشغل منصب زميل في جمعية النهوض بالذكاء الاصطناعي ومعهد مهندسي الكهرباء والإلكترونيات في الولايات المتحدة الأمريكية وجمعية آلات الحوسبة، تقديراً للمساهمات التي قدمها في مجال تطوير خوارزميات تعلم الآلة وتصميم البرمجيات.
واحدة من بين نقاط قوة تقنيةٍ مثل تكنولوجيا معالجة اللغة الطبيعية هي قدرتها على تنفيذ مهامَ تتسم.....
اقرأ المزيد