التعلُّم الاتحادي هو أسلوب للتعلُّم الآلي (ML) يسمح بتدريب النماذج عبر أجهزة أو خوادم لا مركزية متعددة تحتفظ بعينات بيانات محلية، دون تبادل البيانات الأولية نفسها. يعالج هذا النهج المخاوف الحرجة المتعلقة بخصوصية البيانات والأمان وحقوق الوصول، مما يتيح التعاون في تدريب النماذج باستخدام البيانات التي لا يمكن أو لا ينبغي جمعها مركزياً. على عكس التدريب المركزي التقليدي حيث يتم تجميع البيانات، فإن التعلم الاتحادي ينقل عملية التدريب إلى موقع البيانات، وغالبًا ما يكون ذلك على أجهزة الذكاء الاصطناعي Edge.
المفاهيم الأساسية للتعلم الموحد
يعمل التعلم الاتحادي من خلال عملية تعاونية وتكرارية يديرها منسق مركزي (خادم):
- توزيع النماذج: يقوم المخدّم المركزي بتهيئة نموذج عالمي (مثل نموذج Ultralytics YOLO للكشف عن الكائنات) وتوزيعه على أجهزة العميل المشاركة أو صوامع البيانات.
- التدريب المحلي: يقوم كل عميل بتدريب النموذج المستلم باستخدام بياناته المحلية لبضع تكرارات. نظرًا لأن البيانات لا تغادر العميل أبدًا، يتم الحفاظ على الخصوصية. يستخدم هذا التدريب المحلي عادةً تقنيات التعلم العميق القياسية (DL).
- تجميع التحديثات: يرسل العملاء تحديثات النموذج فقط (مثل الأوزان أو التدرجات المستفادة) إلى الخادم المركزي، وليس البيانات الأساسية. غالبًا ما يتم تأمين هذه التحديثات باستخدام تقنيات مثل الخصوصية التفاضلية أو التجميع الآمن.
- تحديث النموذج العام: يقوم الخادم بتجميع التحديثات المستلمة (على سبيل المثال، عن طريق حساب المتوسط) لتحسين النموذج العام.
- التكرار: تتكرر هذه الدورة، مما يؤدي إلى تحسين النموذج العالمي تدريجيًا من خلال المعرفة المكتسبة عبر جميع العملاء المشاركين دون المساس بخصوصية البيانات الأولية. يوفر الذكاء الاصطناعي Google رؤى حول أبحاث وتطبيقات التعلُّم الموحد الخاصة بهم.
على الرغم من ارتباطه بالتدريب الموزع، إلا أن التعلم الاتحادي يفترض على وجه التحديد أن البيانات غير معرفية (غير موزعة بشكل متطابق ومستقل)، ولا مركزية حسب التصميم، ويؤكد على الحفاظ على الخصوصية كمبدأ أساسي.
تطبيقات التعلّم الاتحادي
يعد التعلم الموحد مفيدًا بشكل خاص في السيناريوهات التي تتضمن بيانات حساسة أو موزعة:
- التنبؤ الذكي للوحة المفاتيح: تستخدم لوحات مفاتيح الهاتف المحمول (مثل Gboard من Google) التعلُّم الاتحادي لتحسين الاقتراحات النصية التنبؤية بناءً على أنماط كتابة المستخدم عبر العديد من الأجهزة، دون إرسال ضغطات المفاتيح الفردية إلى خوادم مركزية. وهذا يعزز تجربة المستخدم مع حماية الخصوصية في الوقت نفسه.
- الرعاية الصحية: يمكن للمستشفيات التعاون لتدريب النماذج التشخيصية، مثل تلك الخاصة بتحليل الصور الطبية، باستخدام بيانات المرضى الموزعة عبر المؤسسات. يسمح ذلك بتدريب نماذج أكثر قوة على مجموعات سكانية متنوعة دون انتهاك لوائح سرية المرضى مثل قانون HIPAA. اقرأ المزيد عن التعلم الموحد لمعلوماتية الرعاية الصحية. تستكشف Ultralytics مجالات مماثلة في حلول الذكاء الاصطناعي في مجال الرعاية الصحية.
فوائد التعلّم الاتحادي
- تعزيز خصوصية البيانات: تظل البيانات الأولية على الأجهزة المحلية، مما يقلل بشكل كبير من مخاطر الخصوصية المرتبطة بانتهاكات البيانات أو إساءة استخدامها.
- انخفاض تكاليف الاتصالات: يتم نقل تحديثات النماذج فقط، والتي عادةً ما تكون أصغر من مجموعات البيانات الأولية، مما يوفر عرض النطاق الترددي.
- الوصول إلى بيانات متنوعة: يتيح التدريب على مجموعات بيانات كبيرة وغير متجانسة موزعة على المستخدمين أو المؤسسات، مما قد يؤدي إلى نماذج أكثر قوة وقابلة للتعميم وأقل عرضة للإفراط في التخصيص.
- الامتثال التنظيمي: يساعد المؤسسات على الامتثال للوائح حوكمة البيانات الصارمة ولوائح الخصوصية (على سبيل المثال، اللائحة العامة لحماية البيانات، وقانون حماية البيانات).
تحديات التعلم الموحد
- اختناقات الاتصالات: يمكن أن يكون الاتصال المتكرر بين الخادم والعديد من العملاء بطيئًا ومكلفًا، خاصة مع الشبكات غير الموثوقة.
- عدم تجانس النظام: غالبًا ما يكون للعملاء قدرات متفاوتة من حيث الأجهزة والاتصال بالشبكة وتوافر الطاقة، مما يعقد التدريب المتزامن. تهدف أطر العمل مثل TensorFlow Federated إلى إدارة ذلك.
- عدم التجانس الإحصائي: غالبًا ما تكون البيانات عبر العملاء غير متجانسة إحصائيًا، مما يعني أنها لا تتبع نفس التوزيع، الأمر الذي يمكن أن يشكل تحديًا لتقارب النماذج والأداء.
- المخاوف الأمنية: على الرغم من تعزيز الخصوصية، يمكن أن يظل النظام عرضة لهجمات عدائية محددة تستهدف تحديثات النماذج أو عملية التجميع، مما يتطلب تدابير قوية لأمن البيانات. تعمل مجتمعات تعلم الآلة التي تحافظ على الخصوصية مثل OpenMined على معالجة هذه المشكلات.
على الرغم من هذه التحديات، يمثل التعلم الموحد تقدماً كبيراً في مجال الذكاء الاصطناعي الذي يحافظ على الخصوصية. ويمكن لمنصات مثل Ultralytics HUB تسهيل نشر الن ماذج وإدارتها، بما في ذلك النماذج التي يُحتمل تطويرها باستخدام النُهج الموحدة. يمكنك استكشاف خيارات نشر النماذج المختلفة في وثائق Ultralytics . يمكن العثور على مزيد من المناقشة حول الجمع بين FL مع التقنيات الأخرى في منشور مدونة التعلم النشط الذي يسرّع تطوير الرؤية الحاسوبية.