قوة الحملات الدعائية وقدرة الذكاء الاصطناعي على مواجهتها

عمر من ضمن ال7 الخريجين من برنامج معالجة اللغات الطبيعية

Monday, June 26, 2023

يشكل عمل محمد عمر مساهمةً كبيرةً في مجال معالجة اللغات الطبيعية، وبشكلٍ خاص في التعرف إلى الحملات الدعائية على منصات التواصل الاجتماعي، ولاسيما في الحالات التي تتضمن مزيجاً من اللغات التي تتوفر لها موارد كثيرة وأخرى تتوفر لها موارد قليلة.

وتتوفر على المستوى العالمي كمية كبيرة من البحوث التي تُعنى باللغات، ويتم تخصيص الكثير من الوقت لدراسة اللغات غير اللغة الإنجليزية والحفاظ عليها وتعليمها كما لتطوير نماذج اللغات. ويساهم عمر في البحوث المعنية بلغته الأم وهي الأوردو الروماني، بالإضافة إلى لغات أخرى.

عمر هو أحد طلاب الدفعة الأولى من خريجي برنامج الماجستير في معالجة اللغات الطبيعية في جامعة محمد بن زايد للذكاء الاصطناعي، التي صنفتها مؤسسة CSRankings كواحدة من أفضل 20 معهداً بحثياً لعلوم الحاسوب في العالم. كما أنه أول فرد من أفراد عائلته يحصل على شهادة الماجستير.

ويقول عمر، وهو مواطن باكستاني: “بصفتي باحثاً في مجال معالجة اللغات الطبيعية، أدرك خير إدراك القدرة التي تملكها اللغة في تشكيل آراء الجمهور والتأثير في الخطاب العام. وتشكل الحملات الدعائية أداة واسعة الانتشار تُستخدم للتلاعب بالرأي العام، وهي مصدر قلق متزايد في العصر الرقمي، لاسيما في المجتمعات ثنائية اللغة حيث لم يتم تخصيص الكثير من الجهود، إن خُصصت أصلاً، لاستكشاف هذه الحملات”.

بصفتي باحثاً في مجال معالجة اللغات الطبيعية، أدرك خير إدراك القدرة التي تملكها اللغة في تشكيل آراء الجمهور والتأثير في الخطاب العام.

محمد عمر
خريج دفعة عام 2023
ويضيف: “مع تزايد نسبة استخدام الإنترنت ومنصات التواصل الاجتماعي، أصبحت الحملات الدعائية منتشرة على نطاق واسع وقادرة على التأثير في مواقف الأفراد وسلوكهم. وتتطرق معظم الجهود لاكتشاف الحملات الدعائية إلى اللغات التي تتوفر لها موارد كثيرة مثل الإنجليزية، ما يعني أنه لم يتم فعلياً استكشاف اللغات ذات الموارد القليلة. هذا ويكثر استخدام التناوب اللغوي في المجتمعات التي تتكلم باللغات ذات الموارد القليلة. ويشمل التناوب اللغوي المزج بين لغات متعددة في النص نفسه، ما يزيد من صعوبة اكتشاف الحملات الدعائية”.

“في علم اللغويات، يشير التناوب اللغوي إلى ممارسة يستخدم بموجبها الشخص لغتَين أو أكثر أو مختلف الألسن، بشكلٍ متبادل في الحديث أو النص نفسه. وفي سياق رسالتي، يشير التناوب اللغوي في نصوص التواصل الاجتماعي إلى النصوص المنشورة على منصات التواصل الاجتماعي التي تستخدم مزيجاً من لغات متعددة، بما في ذلك الإنجليزية والأوردو الروماني”.

وعلى الرغم من تخرج عمر في 4 يونيو، سيتابع بحثه وهو يأمل أن يقدم ورقة بحثية حول تقنيات اكتشاف الحملات الدعائية في نصوص التناوب اللغوي إلى مؤتمر الأساليب التجريبية في معالجة اللغات الطبيعية لعام 2023، وهو من أبرز المؤتمرات المعنية ببحوث معالجة اللغات الطبيعية وله أثر كبير في مجالَي معالجة اللغات الطبيعية والذكاء الاصطناعي.

بالإضافة إلى ذلك، يمكن توسيع نطاق النموذج الذي يطوره عمر ليشمل لغات أخرى ذات موارد قليلة لا تحظى بتمثيل كافٍ. ويفسر قائلاً: “هذه إحدى ميزات استخدام نماذج التعلم العميق لإنجاز مهام معالجة اللغات الطبيعية لأنه يمكن تدريبها على كميات كبيرة من بيانات النصوص ومن ثم ضبطها لتكون ملائمة لمهام محددة. ولقد أجريت تجارب باستخدام نماذج لغوية أحادية وثنائية اللغة ومتعددة اللغات وعابرة للّغات ومن ثم قمت بضبطها وفق مجموعات البيانات التي كنت قد أعددتها، وهي تشمل بيانات مسماة تم تطبيق التناوب اللغوي عليها. وبعد ذلك، عملت على تقييم أدائها. ووجدت أن نموذج XLM RoBERTa المضبوط وفق لغة الأوردو الروماني سجل أداءً أفضل من سائر نماذج خط الأساس لمعالجة اللغات الطبيعية بالنسبة لهذه المهمة ومجموعة البيانات”.

ويفتخر عمر بأنه يشارك في برنامج رائد يقود توجّه البحوث في مجال معالجة اللغات الطبيعية. ويضيف: “لأنني طالب في الدفعة الأولى من البرنامج، توفرت لي فرص للعمل بشكلٍ وثيق مع أعضاء الهيئة التدريسية ذوي السمعة العالمية ولاستخدام تقنيات متطورة للغاية والتعاون مع فريق متنوع من الزملاء الذي يشاركونني شغفي بمعالجة اللغات الطبيعية”.

ويكمل: “لا ينفك مجال معالجة اللغات الطبيعية ينمو ويقدم لنا إمكانات هائلة لها جانب إيجابي وآخر سلبي. فمن جهة، ساهم هذا المجال في ابتكار أدوات متطورة مثل “تشات جي بي تي” التي يمكنها دعم عدة مهام بحثية. ولكن من جهة أخرى، تبرز بعض المخاوف من أن يتم استخدام معالجة اللغات الطبيعية للتلاعب بالأشخاص أو خداعهم، لاسيما نظراً لانتشار تقنية التزييف العميق. على الرغم من هذه التحديات، أظن بشدة أن بوسع معالجة اللغات الطبيعية أن تساهم بشكلٍ إيجابي في بناء المستقبل”.

انتقل عمر إلى أبوظبي في عام 2020 بعد حصوله على شهادة البكالوريوس في علم الحاسوب من جامعة لاهور للعلوم الإدارية في باكستان، وهي المرة الأولى التي يغادر فيها بلده الأهم لمتابعة دراسته. وعلّق عمر على ذلك قائلاً: “واجهت تحديات في بداية مسيرتي في جامعة محمد بن زايد للذكاء الاصطناعي لكنّها كانت تجربة مجدية ومثمرة جداً في النهاية. واجهت صعوبة بادئ الأمر لإيجاد توازن بين دراستي والعمل البحثي وحياتي الشخصية لكنني تعلمت في النهاية كيف أدير وقتي بفاعلية أكبر وأحدد المسؤوليات ذات الأولوية. كانت تجربتي في الجامعة تجربة غيّرت حياتي بالفعل، إذ تمكنت كطالب من الوصول إلى موارد ذات مستوى عالمي واستفدت من بيئة تعلّم داعمة سمحت لي بتطوير مهاراتي. وإنّ أعضاء الهيئة التدريسية وفريق العمل في الجامعة هم من أفضل العاملين في مجالهم، وكانت خبرتهم وتوجيهاتهم قيّمة جداً بالنسبة لي وساعدني لأنمو وأتطور كباحث. سُنحت لي أيضًا الفرصة للعمل على مشاريع صعبة وحضور مؤتمرات وورش عمل والتعاون مع زملاء من مختلف الخلفيات، وهذا ما ساعدني على توسيع معرفتي والتعرف على وجهات نظر جديدة. لقد أعدّتني دراستي في جامعة محمد بن زايد للذكاء الاصطناعي جيداً لأتعامل مع متطلبات القطاع. وتؤهلني مهارات البحث والبرمجة التي اكتسبتها بشكلٍ خاص لتحليل المشاكل المعقدة وتصميم الحلول المبتكرة وتطبيقها بفاعلية”.

شارك عمر في برنامج تدريب مهني اختياري كعالم بيانات في 'جي 42 للرعاية الصحية' وهي الشركة الرائدة في الإمارات العربية المتحدة في مجال الذكاء الاصطناعي والحوسبة السحابية. ولقد شارك 33 طالباً من خريجي دفعة العام 2022 والبالغ عددهم 59 طالباً في برامج تدريبية اختيارية في الصيف الماضي من أجل اكتساب خبرة عملية وقيّمة في القطاع. وتجدر الإشارة إلى أن عمر يشغل حالياً منصب مهندس بيانات في 'جي 42 للرعاية الصحية'، حيث يعمل على بناء وصيانة مسارات عمل للبيانات تقوم بمعالجة وتحليل كميات كبيرة من البيانات المتعلقة بالرعاية الصحية بهدف إجراء عمليات تقييم الجودة والتحقق منها من أجل ضمان دقة البيانات واكتمالها واتساقها. ولا شك في أن الرعاية الصحية هي موضوع يهم الجميع، كما يتم اليوم استخدام معالجة اللغات الطبيعية وتعلم الآلة أكثر وأكثر لمساعدة الأطباء على تحديد أفضل خطط للعلاج الأساسي للمرضى.

ويرغب عمر في العمل في مجال البيانات في نهاية المطاف، إذ يفيد: “تشكل البيانات أساس التقنيات الحديثة ويتم إنشاء البيانات بوتيرة سريعة للغاية من خلال الأجهزة والأنظمة التي نستخدمها والتي لا ينفك عددها يتزايد. يهدف مجالَي علم البيانات وهندسة البيانات إلى العثور على المنطق في هذا الكم الهائل من البيانات للحصول على معلومات ومعرفة قيّمة لكي نتّخذ قرارات مدروسة. وما يدهشني ويثير اهتمامي في ما يخص البيانات هو مدى تنوع استخداماتها، إذ يمكن تطبيقها في مجالات متعددة ومتنوعة، من المالية إلى الرعاية الصحية والتعليم والتواصل الاجتماعي.”

أخبار ذات صلة

thumbnail
Tuesday, November 26, 2024

النماذج اللغوية الكبيرة وفهم انفعالات الإنسان وعواطفه

فريق بحثي من جامعة محمد بن زايد للذكاء الاصطناعي وجامعة موناش يبحث في مدى قدرة النماذج اللغوية.....

  1. البحوث ,
  2. النماذج اللغوية الكبيرة ,
  3. EMNLP ,
  4. معالجة اللغة الطبيعية ,
  5. انفعالات الإنسان ,
  6. التعاطف ,
اقرأ المزيد