اكتشف كيف يعمل التدريب الموزع على توزيع أحمال عمل الذكاء الاصطناعي عبر عدة وحدات معالجة رسومات. تعلم كيفية تسريع تدريب Ultralytics باستخدام DDP للحصول على نتائج أسرع وأكثر دقة.
التدريب الموزع هو طريقة في التعلم الآلي يتم فيها تقسيم عبء عمل تدريب النموذج على عدة معالجات أو أجهزة. هذه الطريقة ضرورية للتعامل مع مجموعات البيانات الضخمة وبنى الشبكات العصبية المعقدة التي قد يستغرق تدريبها على جهاز واحد وقتًا غير عملي. من خلال الاستفادة من القدرة الحاسوبية المجمعة لعدة وحدات معالجة رسومات (GPU) أو وحدات Tensor (TPU)، يعمل التدريب الموزع على تسريع دورة التطوير بشكل كبير، مما يسمح للباحثين والمهندسين بالتكرار بشكل أسرع وتحقيق دقة أعلى في نماذجهم.
الفكرة الأساسية وراء التدريب الموزع هي التوازي. بدلاً من معالجة البيانات بالتسلسل على شريحة واحدة، تُقسم المهمة إلى أجزاء أصغر يتم معالجتها في وقت واحد. هناك استراتيجيتان أساسيتان لتحقيق ذلك:
أدى التدريب الموزع إلى تحويل الصناعات من خلال إتاحة حل المشكلات التي كانت في السابق غير قابلة للتحقيق حسابيًا.
إن ultralytics تسهل المكتبة تنفيذ التدريب المتوازي للبيانات الموزعة (DDP).
يمكنك توسيع نطاق تدريبك على أحدث التقنيات
يولو26 النماذج عبر وحدات معالجة رسومات متعددة ببساطة عن طريق تحديد
مؤشرات الأجهزة في حجج التدريب الخاصة بك.
from ultralytics import YOLO
# Load a pre-trained YOLO26 model
model = YOLO("yolo26n.pt")
# Train the model using two GPUs (device 0 and 1)
# The library automatically handles the DDP communication backend
results = model.train(data="coco8.yaml", epochs=100, device=[0, 1])
من المفيد التمييز بين التدريب الموزع والمصطلحات المماثلة في نظام التعلم الآلي لفهم أدوارها المحددة:
قد تكون إدارة البنية التحتية للتدريب الموزع أمرًا معقدًا. تعمل المنصات الحديثة على تبسيط ذلك من خلال توفير بيئات مُدارة. على سبيل المثال، Ultralytics للمستخدمين إدارة مجموعات البيانات وبدء عمليات التدريب التي يمكن نشرها في بيئات السحابة أو المجموعات المحلية. يعمل هذا التكامل على تبسيط سير العمل بدءًا من تعليق البيانات وحتى النشر النهائي للنموذج، مما يضمن أن يكون التوسع إلى وحدات معالجة رسومات متعددة سلسًا قدر الإمكان. وبالمثل، يوفر مزودو الخدمات السحابية مثل Google Vertex AI و Amazon SageMaker بنية تحتية قوية لتشغيل مهام التدريب الموزعة على نطاق المؤسسة.