اكتشف كيف TensorRT نماذج التعلم العميق NVIDIA . تعلم كيفية تصدير Ultralytics إلى TensorRT استدلال عالي السرعة ومنخفض الكمون اليوم.
TensorRT مجموعة أدوات تطوير برمجيات (SDK) عالية الأداء للتعلم العميق تم تطويرها بواسطة NVIDIA. وهي مصممة لتحسين نماذج الشبكات العصبية من أجل النشر، مما يوفر زمن استجابة منخفضًا وإنتاجية عالية لتطبيقات التعلم العميق . من خلال عملها كمترجم تحسين، TensorRT الشبكات المدربة من الأطر الشائعة مثل PyTorch و TensorFlow هيكلتها لتعمل بكفاءة علىوحدات معالجة الرسومات NVIDIA . هذه القدرة ضرورية لتشغيل نماذج الذكاء الاصطناعي المعقدة في بيئات الإنتاج حيث السرعة والكفاءة أمران بالغا الأهمية.
TensorRT الوظيفة الأساسية لـ TensorRT تحويل شبكة عصبية مدربة إلى "محرك" مُحسّن ومُعدّل خصيصًا للأجهزة المستهدفة. ويتم تحقيق ذلك من خلال عدة تقنيات متقدمة:
نظرًا لقدرته على معالجة كميات هائلة من البيانات بأقل تأخير ممكن، TensorRT استخدام TensorRT على نطاق واسع في الصناعات التي تعتمد على الرؤية الحاسوبية ومهام الذكاء الاصطناعي المعقدة حيث يعد التوقيت أمرًا بالغ الأهمية.
يُعد دمج TensorRT في سير عملك أمراً سهلاً ومباشراً باستخدام أدوات الذكاء الاصطناعي الحديثة. إن ultralytics توفر الحزمة
طريقة سلسة لتحويل PyTorch القياسية إلى TensorRT . وهذا يتيح للمستخدمين الاستفادة من
أحدث ما توصلت إليه الهندسة المعمارية Ultralytics YOLO26 مع
تسريع الأجهزة من NVIDIA . بالنسبة للفرق التي تسعى إلى إدارة مجموعات البيانات وخطوط التدريب قبل التصدير،
فإن منصة Ultralytics توفر بيئة شاملة لإعداد
نماذج لمثل هذا النشر عالي الأداء.
يوضح المثال التالي كيفية تصدير نموذج YOLO26 إلى ملف TensorRT (.engine) و
استخدمه لـ الاستدلال في الوقت الحقيقي:
from ultralytics import YOLO
# Load the latest stable YOLO26 model (nano size)
model = YOLO("yolo26n.pt")
# Export the model to TensorRT format (creates 'yolo26n.engine')
# This step optimizes the computational graph for your specific GPU
model.export(format="engine")
# Load the optimized TensorRT engine for high-speed inference
trt_model = YOLO("yolo26n.engine")
# Run inference on an image source
results = trt_model("https://ultralytics.com/images/bus.jpg")
من المهم التمييز TensorRT والمصطلحات الأخرى التي كثيرًا ما نسمعها في مجال نشر النماذج:
بالنسبة للمطورين الذين يهدفون إلى تعظيم أداء وكلاء الذكاء الاصطناعي أو أنظمة الرؤية الخاصة بهم، فإن فهم الانتقال من إطار عمل التدريب إلى وقت تشغيل محسّن مثل TensorRT خطوة أساسية في MLOps الاحترافي.