تحسين نماذج التعلم العميق باستخدام TensorRT للاستدلال الأسرع والفعال على وحدات معالجة الرسومات NVIDIA . تحقيق أداء في الوقت الفعلي مع YOLO وتطبيقات الذكاء الاصطناعي.
TensorRT هو مُحسِّن استقرائي عالي الأداء للتعلم العميق ومكتبة وقت تشغيل تم تطويرها بواسطة NVIDIA. وهي تعمل على تسريع نماذج التعلم العميق علىوحدات معالجة الرسومات NVIDIA (GPUs) من خلال تطبيق تقنيات تحسين مختلفة. الهدف الأساسي لمكتبة TensorRT هو تحقيق أقل زمن استنتاج ممكن وأعلى إنتاجية للنماذج المنشورة في بيئات الإنتاج، مما يجعلها حاسمة لتطبيقات الاستدلال في الوقت الفعلي.
يأخذ TensorRT شبكة عصبية مُدرَّبة، وغالبًا ما يتم تصديرها من أطر مثل PyTorch أو TensorFlowويحسنها خصيصًاGPU NVIDIA GPU المستهدفة. تتضمن خطوات التحسين الرئيسية ما يلي:
تؤدي هذه التحسينات إلى محرك استدلالي عالي الكفاءة في وقت التشغيل مصمم خصيصًا لنموذج وأجهزة محددة.
TensorRT هو هدف نشر رئيسي لنماذج Ultralytics YOLO . يمكن للمستخدمين تصدير نماذج Ultralytics YOLO المدربة الخاصة بهم إلى تنسيق TensorRT لتحقيق سرعات كبيرة على أجهزة NVIDIA بما في ذلك الأجهزة المتطورة مثل NVIDIA Jetson. يتيح ذلك تطبيقات عالية الأداء في مختلف المجالات. غالبًا ما تعرض صفحات المقارنة بين النماذج، مثل مقارنةYOLOv5 مقابل مقارنة RT-DETR سرعات الاستدلال التي تم تحقيقها باستخدام تحسين TensorRT . يوفر Ultralytics أيضًا أدلة للتكامل مع منصات NVIDIA مثل دليل DeepStream على NVIDIA Jetson.
يُستخدَم TensorRT على نطاق واسع حيث يكون الاستدلال السريع والفعال على أجهزة NVIDIA أمرًا بالغ الأهمية: