Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

التعلم الموحد (Federated Learning)

اكتشف كيف يتيح التعلم الفيدرالي تدريب النماذج اللامركزية مع الحفاظ على خصوصية البيانات. تعلم كيفية تدريب Ultralytics على الأجهزة الطرفية بأمان.

التعلم الفيدرالي هو تقنية تعلم آلي لامركزية تسمح لعدة أجهزة بتدريب نموذج بشكل تعاوني دون مشاركة بيانات التدريب الأولية الخاصة بها. على عكس الطرق المركزية التقليدية حيث يتم تجميع البيانات في بحيرة بيانات أو خادم واحد، فإن التعلم الفيدرالي يجلب النموذج إلى البيانات. هذا النهج يغير بشكل جذري الطريقة التي نتعامل بها مع خصوصية البيانات وأمنها، مما يمكّن المؤسسات من استخدام المعلومات الحساسة الموجودة على الهواتف الذكية أو أجهزة إنترنت الأشياء أو الخوادم الخاصة مع ضمان أن البيانات لا تغادر مصدرها الأصلي أبدًا.

كيف تعمل العملية الاتحادية

تتضمن الآلية الأساسية للتعلم الفيدرالي دورة تكرارية من الاتصال بين الخادم المركزي و الأجهزة العميلة المشاركة. تسمح هذه العملية بالتحسين المستمر لشبكة عصبية عالمية دون المساس بخصوصية المستخدم .

  1. تهيئة النموذج العالمي: يقوم خادم مركزي بتهيئة نموذج أساسي عام وبثه إلى مجموعة مختارة من الأجهزة العميلة المؤهلة.
  2. التدريب المحلي: يقوم كل عميل بتدريب النموذج بشكل مستقل باستخدام مجموعة البيانات المحلية الخاصة به . وهذا يستفيد من قدرات الذكاء الاصطناعي الطرفي لحساب التحديثات على الجهاز.
  3. تجميع التحديثات: بدلاً من تحميل الصور أو النصوص الأولية، يرسل العملاء فقط تحديثات نماذجهم — وبالتحديد التدرجات المحسوبة أو أوزان النماذج— إلى الخادم المركزي.
  4. التحسين الشامل: يستخدم الخادم خوارزميات مثل Federated Averaging (FedAvg) لدمج هذه التحديثات المتنوعة في نموذج شامل جديد ومتفوق.
  5. التكرار: يتم إرسال النموذج المحسّن إلى العملاء، وتكرر الدورة حتى يحقق النظام الدقة المطلوبة.

التعلم الموحد مقابل التدريب الموزع

من المهم التمييز بين التعلم الفيدرالي ونماذج التدريب المماثلة، لأنها تحل مشاكل هندسية مختلفة .

  • التدريب الموزع: يحدث هذا عادةً في بيئة خاضعة للرقابة، مثل مركز بيانات واحد، حيث يتم تقسيم مجموعة بيانات ضخمة ومركزية على عدة وحدات معالجة رسومات (GPU) لتسريع عملية الحساب. الهدف الأساسي هو سرعة المعالجة، ويتم توصيل العقد بواسطة روابط ذات نطاق ترددي عالٍ.
  • التعلم الفيدرالي: يعمل هذا في بيئة غير خاضعة للرقابة مع أجهزة غير متجانسة (مثل الهواتف المحمولة) التي لها أعمار بطاريات واتصالات شبكة متفاوتة. الهدف الأساسي هو الخصوصية والوصول إلى البيانات، وليس بالضرورة السرعة الخام.

تطبيقات واقعية

أدت القدرة على التدريب على البيانات اللامركزية إلى فتح أبواب جديدة للصناعات المقيدة بامتثال صارم للوائح التنظيمية.

  • الذكاء الاصطناعي في الرعاية الصحية: يمكن للمستشفيات التعاون لتدريب نماذج قوية للكشف عن الأورام باستخدام تحليل الصور الطبية دون مشاركة سجلات المرضى. وهذا يسمح للمؤسسات بالاستفادة من مجموعة بيانات أكبر مع الالتزام بلائح HIPAA.
  • لوحات المفاتيح التنبؤية: تستخدم أنظمة تشغيل الأجهزة المحمولة التعلم الموحد لتحسين توقع الكلمة التالية ومعالجة اللغة الطبيعية (NLP). من خلال التعلم من أنماط الكتابة محليًا، يحسن الهاتف تجربة المستخدم دون نقل الرسائل الخاصة إلى السحابة.
  • الذكاء الاصطناعي في قطاع السيارات: يمكن لأساطيل المركبات ذاتية القيادة أن تتعلم من ظروف الطرق المحلية وتدخلات السائقين. يتم تجميع هذه الرؤى لتحديث قدرات القيادة الذاتية للأسطول دون تحميل تيرابايت من مقاطع الفيديو الخام إلى خادم مركزي.

مثال على التعليمات البرمجية: محاكاة تحديث عميل محلي

في سير العمل الموحد، تتمثل مهمة العميل في ضبط النموذج العالمي على مجموعة بيانات محلية صغيرة. يوضح Python التالي كيف يمكن للعميل إجراء جولة واحدة من التدريب المحلي باستخدام أحدث نموذج YOLO26.

from ultralytics import YOLO

# Load the global model received from the central server
# In a real FL system, this weight file is downloaded from the aggregator
model = YOLO("yolo26n.pt")

# Perform local training on the client's private data
# We train for 1 epoch to simulate a single round of local contribution
results = model.train(data="coco8.yaml", epochs=1, imgsz=640)

# The updated 'best.pt' weights would now be extracted
# and sent back to the central server for aggregation
print("Local training round complete. Weights ready for transmission.")

المزايا والتوجهات المستقبلية

الميزة الرئيسية للتعلم الفيدرالي هي الخصوصية حسب التصميم. فهو يتيح للمطورين التدريب على بيانات اصطناعية أو حالات حقيقية متطرفة لا يمكن الوصول إليها بخلاف ذلك بسبب قوانين الخصوصية مثل اللائحة العامة لحماية البيانات (GDPR). علاوة على ذلك، فإنه يقلل من تكاليف عرض النطاق الترددي للشبكة لأن بيانات الفيديو أو الصور عالية الدقة تظل محلية.

ومع ذلك، لا تزال هناك تحديات، لا سيما فيما يتعلق بتباين الأنظمة (اختلاف الأجهزة من حيث قوة المعالجة) والأمن ضد الهجمات العدائية. يمكن للعملاء الضارين نظريًا تقديم تحديثات "مسمومة" لإفساد النموذج العالمي. للتخفيف من ذلك، غالبًا ما يتم دمج تقنيات متقدمة مثل الخصوصية التفاضلية لإضافة ضوضاء إحصائية إلى التحديثات، مما يضمن عدم إمكانية عكس هندسة مساهمة أي مستخدم فردي.

تتطور أدوات مثل Ultralytics للمساعدة في إدارة تعقيد نماذج التدريب عبر بيئات متنوعة، مما يضمن أن يكون مستقبل الذكاء الاصطناعي قويًا و خاصًا. تواصل الأطر المبتكرة مثل TensorFlow و PySyft توسيع حدود ما هو ممكن مع التعلم الآلي اللامركزي الذي يحافظ على الخصوصية.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن