تعرف على كيفية تسريع وحدات معالجة الرسومات (GPU) للذكاء الاصطناعي والتعلم العميق. اكتشف قوة الحوسبة المتوازية لتدريب نماذج Ultralytics وتحسين الاستدلال في الوقت الفعلي.
وحدة معالجة الرسومات (GPU) هي دائرة إلكترونية متخصصة مصممة في الأصل لتسريع معالجة وإنشاء الصور في مخزن الإطارات المؤقت لإخراج العرض. على الرغم من أن جذورها تكمن في عرض رسومات الكمبيوتر للألعاب والتصور الاحترافي ، فقد تطورت وحدات معالجة الرسومات لتصبح المحرك الأساسي للذكاء الاصطناعي الحديث (AI). على عكس المعالج القياسي الذي يستخدم عددًا قليلاً من النوى القوية لمعالجة المهام بالتسلسل، تتكون GPU من آلاف النوى الأصغر حجمًا والأكثر كفاءة والمصممة لمعالجة مهام متعددة في وقت واحد. هذه القدرة، المعروفة باسم الحوسبة المتوازية، تجعلها فعالة بشكل استثنائي لعمليات المصفوفات والمتجهات الضخمة التي تدعم التعلم العميق (DL) والشبكات العصبية المعقدة (NN).
السبب الرئيسي الذي يجعل وحدات معالجة الرسومات (GPU) لا غنى عنها في التعلم الآلي (ML) هو قدرتها على إجراء عمليات ضرب المصفوفات بسرعة عالية. أطر التعلم العميق مثل PyTorch و TensorFlow مُحسّنة خصيصًا للاستفادة من تسريع الأجهزة. وينتج عن ذلك تقليل وقت تدريب النموذج بشكل كبير، حيث غالبًا ما يحول ما قد يستغرق أسابيع من الحساب على معالج قياسي إلى ساعات على GPU. عادةً ما يتم قياس الإنتاجية الحسابية لهذه الأجهزة بالفلوبس (عمليات النقطة العائمة في الثانية)، وهو مقياس مهم لقياس قدرة الأجهزة على التعامل مع المتطلبات الصارمة للنماذج الحديثة مثل YOLO26.
لفهم مشهد الأجهزة، من المفيد التمييز GPU وحدة GPU ووحدات المعالجة الأخرى:
أدى استخدام وحدات معالجة الرسومات عالية الأداء إلى إحداث ثورة في الابتكارات في مختلف الصناعات:
عند استخدام ultralytics الحزمة، GPU استخدام وحدة GPU بسيط وموصى به بشدة من أجل
كفاءة سير العمل. تدعم المكتبة الكشف التلقائي عن الأجهزة، ولكن يمكن للمستخدمين أيضًا تحديد الجهاز بشكل صريح
.
يوضح المثال التالي كيفية تدريب نموذج YOLO26 على أول GPU متاحة:
from ultralytics import YOLO
# Load the YOLO26n model
model = YOLO("yolo26n.pt")
# Train the model on the first available GPU (device=0)
# This significantly accelerates training compared to CPU usage
results = model.train(data="coco8.yaml", epochs=5, imgsz=640, device=0)
بالإضافة إلى التدريب، تلعب وحدات معالجة الرسومات (GPU) دورًا مهمًا في نشر النماذج. لتحقيق أقصى قدر من الكفاءة أثناء الاستدلال، غالبًا ما يتم تحويل النماذج إلى تنسيقات محسّنة مثل TensorRT، والتي تعيد هيكلة الشبكة العصبية لتتوافق تمامًا مع GPU المحددة، مما يقلل من زمن الاستجابة. بالنسبة للمطورين الذين لا يملكون إمكانية الوصول إلى أجهزة محلية متطورة ، توفر Ultralytics حلولًا قائمة على السحابة لإدارة مجموعات البيانات وتدريب النماذج على GPU قوية عن بُعد. تعزز هذه الإمكانية الوصول إلى الابتكار في Edge AI، مما يسمح بتنفيذ مهام مهام الرؤية الحاسوبية (CV) المعقدة على أجهزة أصغر حجمًا وأكثر كفاءة في استهلاك الطاقة في هذا المجال.