تجمع أجهزتنا ثروة من البيانات حول حياتنا. ولهذه البيانات فوائد متعددة، مثل إنذارنا بشأن المشاكل الصحية وتحسين حساباتنا المصرفية وتوفير تدفق لامتناهي من المحتوى المثير للاهتمام الذي نستهلكه. ولكن بعد جمع هذه البيانات وتخزينها بطريقة مركزية، تصبح هدفًا للقراصنة وعملاء التسويق والحملات السياسية وغيرها من الجهات. كيف يمكننا الاستفادة من البيانات التي نجمعها من دون تعريض أنفسنا للخطر؟
حاول الأستاذ المساعد في قسم تعلّم الآلة في جامعة محمد بن زايد للذكاء الاصطناعي، الدكتور سامويل هورفاث، أن يجيب على بعض هذه الأسئلة في بحوثه. وتركز اهتماماته البحثية على التقاطع بين الرياضيات وعلوم الحاسوب وتعلّم الآلة والتحسين والإحصاءات، وتركّز بشكلٍ خاص على مجال واحد هو التعلّم المتحد، وهو مجال فرعي من تعلّم الآلة.
لقد دخل مصطلح تعلّم الآلة اليوم المعاجم ليشير إلى طريقة “تدريب” أنظمة الحاسوب على فهم مجموعات البيانات واستخدامها لتحقيق أهداف متنوعة. وعلى سبيل المثال، هذه هي الطريقة التي تستخدمها شركة نتفليكس لتقترح عليك خيارات ذات صلة بالمحتوى الذي يهمك استنادًا إلى أنماط المشاهدة السابقة الخاصة بك.
ويقول هورفاث في هذا الصدد: “يضيف التعلّم المتحد إطارًا جديدًا إلى تعلّم الآلة عبر نقل التدريب ليحصل مباشرةً لدى العميل فلا تغادر البيانات الأصلية الجهاز أبدًا بهدف الحد من المخاطر التي قد تنتج عن الجمع المركزي للبيانات”. ويضيف: “أما التحدي فيكمن في تصميم أنظمة تستطيع احترام الخصوصية، والتدرّب استنادًا إلى بيانات لا يمكن جمعها مباشرةً، في إطار لا يسمح بطلب تحديثات من المستخدم إلا بشكلٍ غير منتظم”.
وتشكل البيانات الصحية التي يتم جمعها وتخزينها في هواتفنا خير مثالٍ على ذلك. ففي حين أن البيانات المتعلقة بصحة قلبك مهمة بالنسبة لك ولطبيبك وتطبيق مراقبة القلب، يجب الحفاظ على خصوصية هذه المعلومات. ولكن للأسف، يعني الحفاظ على هذه الخصوصية أن النماذج التي قد تساعد على إنقاذ حياتنا لا يمكن أن تتحول إلى التنبؤات القوية التي نحتاجها.
يشبه تعلّم الآلة في بعض أشكاله النماذج الحاسوبية التي تستهلك ما تشتهيه من مائدة البيانات التي توفرها الأجهزة التي نرتديها والفحوصات التي تجريها المستشفيات. ولكن إذا منعنا هذه النماذج الحاسوبية من استهلاك البيانات، فهي بكل بساطة لن تتمكن من أداء وظائفها. يظهر بالتالي نزاع طبيعي بين القدرة التنبؤية القوية من جهة، والخصوصية من جهة أخرى. وهذه هي المشكلة تحديدًا التي يستطيع التعلّم المتحد معالجتها بتفوّق، بحسب هورفاث.
ويفسّر قائلًا: “في أطر التعلّم هذه، تكون البيانات موزّعة عبر مختلف العملاء ويجب الحفاظ على خصوصية بيانات العميل، حيث يسعى البحث الذي أجريه إلى فهم التحديات التي قد تنتج عن أنواع مجموعات البيانات الموزعة هذه، بالإضافة إلى تصميم وتحليل طُرق وخوارزميات تمكّن إجراء التدريب بفعالية أكبر.
ويتساءل: “السؤال الذي أطرحه هو: كيف يمكننا الاستمرار بالتقدم في مجال تعلّم الآلة في حال خسرنا إمكانية الوصول إلى البيانات بسبب المتطلبات المتعلقة بالخصوصية؟” بحسب هورفاث، يأتي التعلّم المتحد ليقدم حلًا قابلًا للتطبيق لهذه
المشكلة، إذ يتمثل الهدف منه في تحليل البيانات اللامركزية الموزعة عبر مالكين/عملاء متعددين والتعلم منها من دون الكشف عن بياناتهم. ويشرح: “نرى أن بعض نماذج التعلّم المتحد التي نسعى إلى تحقيقها الآن تهدف إلى احترام خصوصية المستخدم وفي الوقت نفسه تلبية احتياجات العملاء الذي يحتاجون إلى الاستفادة من هذه البيانات لتحسين نتائجهم الصحية على سبيل المثال. بهذه الطريقة، نمكّن التدريب على التنبؤ بالنوبات القلبية مثلًا، استنادًا إلى مجموعات أكبر بكثير من البيانات اللامركزية”.
ويقول هورفاث: “هذا هو الهدف النهائي من التعلّم المتحد. وفي الواقع، قد نتمكن في بعض الحالات من تعزيز القدرة الحاسوبية بشكلٍ عام لأننا نستخدم قدرًا قليلًا ليس إلا من سعات ملايين الأجهزة عوضًا عن استخدام مورد رئيسي واحد”.
يأخذ هذا النوع من التعلّم المتحد عادةً شكلَين، بحسب هورفاث. يشمل الشكل الأول المذكور أعلاه الباحثين أو مزودي الخدمات الذين يحتاجون إلى الوصول إلى كميات هائلة من البيانات لتعزيز قدرات التطبيقات وأنظمة المعلومات التابعة لهم بشكلٍ عام. أما الشكل الثاني، فيشمل المؤسسات التي تريد التعاون مع بعضها ولكن التي تدعوها بعض الأسباب إلى عدم الرغبة بمشاركة البيانات مباشرةً.
ويفيد هورفاث: “لنأخذ على سبيل المثال مؤسستَين متنافستَين، وتشكل المصارف أو المستشفيات خير مثال على ذلك. كيف يمكننا تعزيز قاعدة المعرفة والفعالية لدى كليهما مع ضمان عدم مشاركة المؤسستَين للبيانات الحساسة جدًا أو حتى البيانات التي قد تعرضهما لخطر؟” ويضيف: “نريد أن نكتشف كيف يمكن استخدام البيانات بشكلٍ آمن وأكثر فعالية ويحترم الخصوصية”.
حصل الدكتور هورفاث على شهادة دكتوراه وشهادة ماجستير في العلوم الإحصائية من جامعة الملك عبدالله للعلوم والتقنية في المملكة العربية السعودية. كما حصل على بكالوريوس العلوم (بامتياز مع مرتبة شرف) في الرياضيات والعلوم الاقتصادية والمالية من جامعة كومينيوس في سلوفاكيا.
وحصل الدكتور هورفاث على جوائز متعددة خلال دراسته، بما في ذلك جائزة أفضل ورقة بحثية في ورشة العمل حول قابلية التوسع والخصوصية والأمن في التعلّم المتحد ضمن مؤتمر نظم معالجة المعلومات العصبية، وجائزة أفضل بوستر علمي في المدرسة الصيفية لعلوم البيانات (دي أس 3) في مدرسة البوليتكنيك في فرنسا، وجائزة أفضل مُراجع في مؤتمر نظم معالجة المعلومات العصبية. وهو يشغل بانتظام منصب عضو في لجان البرامج في أهم المجلات والمؤتمرات في مجال تعلّم الآلة، ومنها مجلة تعلّم الآلة، والمؤتمر الدولي لتعلّم الآلة، ومؤتمر نظم معالجة المعلومات العصبية
مي شعبان، طالبة الدكتوراة في قسم تعلم الآلة بجامعة محمد بن زايد للذكاء الاصطناعي، تعمل على تطوير.....
محمد رضوان يشرح كيف يساعد نموذجه التنبئي، HuLP، الأطباء في تقييم كيفية تطور الحالات المرضية بالسرطان لدى.....
اقرأ المزيدعلماء من جامعة محمد بن زايد للذكاء الاصطناعي ينجحون في تطوير أسلوب جديد يعتمد على التعلم العميق،.....