Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

تكميم النموذج (Model Quantization)

تعرف على كيفية تحسين نموذج التكمية Ultralytics من أجل الذكاء الاصطناعي المتطور. اكتشف كيفية تقليل الذاكرة وتقليل زمن الاستجابة وتصدير نماذج INT8 من أجل استنتاج أسرع.

تكمية النموذج هي تقنية متطورة لتحسين النموذج تُستخدم لتقليل تكاليف الحوسبة والذاكرة لتشغيل نماذج التعلم العميق. في سير عمل التدريب القياسي، عادةً ما تخزن الشبكات العصبية المعلمات (weights and biases) وخرائط التنشيط باستخدام أرقام عائمة 32 بت (FP32). في حين أن هذه الدقة العالية تضمن حسابات دقيقة أثناء التدريب، إلا أنها غالبًا ما تكون غير ضرورية للاستدلال. يحول التكمية هذه القيم إلى تنسيقات أقل دقة، مثل الأرقام العائمة 16 بت (FP16) أو الأعداد الصحيحة 8 بت (INT8)، مما يؤدي إلى تقليص حجم النموذج بشكل فعال وتسريع سرعة التنفيذ دون المساس بالدقة بشكل كبير.

لماذا التكمية مهمة

الدافع الرئيسي للتكمية هو الحاجة إلى نشر ذكاء اصطناعي قوي على أجهزة محدودة الموارد. مع زيادة تعقيد نماذج الرؤية الحاسوبية مثل YOLO26، تزداد متطلباتها الحسابية . تعالج التكمية ثلاثة عوائق حاسمة:

  • مساحة الذاكرة: من خلال تقليل عرض بتات الأوزان (على سبيل المثال، من 32 بت إلى 8 بت)، يتم تقليل متطلبات التخزين للنموذج بما يصل إلى 4 أضعاف. وهذا أمر حيوي للتطبيقات المحمولة حيث يكون حجم التطبيق محدودًا.
  • زمن الاستدلال: العمليات ذات الدقة المنخفضة أقل تكلفة من الناحية الحسابية. يمكن للمعالجات الحديثة، خاصة تلك المزودة بوحدات معالجة عصبية (NPU) متخصصة، تنفيذ عمليات INT8 بسرعة أكبر بكثير من FP32، مما يقلل بشكل كبير من زمن الاستدلال.
  • استهلاك الطاقة: نقل بيانات أقل عبر الذاكرة وإجراء عمليات حسابية أبسط يستهلك طاقة أقل، مما يطيل عمر البطارية في الأجهزة المحمولة والمركبات ذاتية القيادة.

مقارنة مع المفاهيم ذات الصلة

من المهم التمييز بين التكمية وتقنيات التحسين الأخرى، لأنها تعدل النموذج بطرق مختلفة :

  • التكمية مقابل التقليم: بينما تقلل التكمية حجم الملف عن طريق خفض عرض بتات المعلمات، فإن تقليم النموذج ينطوي على إزالة الوصلات غير الضرورية (الأوزان) بالكامل لإنشاء شبكة متفرقة. يؤدي التقليم إلى تغيير بنية النموذج، بينما يؤدي التكمية إلى تغيير تمثيل البيانات.
  • التكمية مقابل تقطير المعرفة: تقطير المعرفة هو تقنية تدريب حيث يتعلم نموذج "طالب" صغير محاكاة نموذج "معلم" كبير. غالبًا ما يتم تطبيق التكمية على نموذج الطالب بعد التقطير لتعزيز أداء الذكاء الاصطناعي المتطور.

تطبيقات واقعية

يتيح التكمية استخدام الرؤية الحاسوبية والذكاء الاصطناعي في مختلف الصناعات التي تعتبر الكفاءة فيها أمراً بالغ الأهمية.

  1. الأنظمة المستقلة: في صناعة السيارات، يجب أن تعالج السيارات ذاتية القيادة البيانات المرئية من الكاميرات و LiDAR في الوقت الفعلي. النماذج المكانية الموزعة على NVIDIA TensorRT تسمح لهذه المركبات detect والعوائق بزمن انتقال يبلغ أجزاء من الألف من الثانية، مما يضمن سلامة الركاب.
  2. الزراعة الذكية: تستخدم الطائرات بدون طيار المزودة بكاميرات متعددة الأطياف نماذج كمية للكشف عن الأجسام لتحديد أمراض المحاصيل أو مراقبة مراحل النمو. ويؤدي تشغيل هذه النماذج محليًا على الأنظمة المدمجة في الطائرات بدون طيارإلى التخلص من الحاجة إلى الاتصالات الخلوية غير الموثوقة في الحقول النائية.

تنفيذ التحويل الكمي باستخدام Ultralytics

تسهل Ultralytics عملية التصدير، مما يتيح للمطورين تحويل نماذج مثل YOLO26 المتطورة إلى تنسيقات محددة. كما توفر Ultralytics أدوات لإدارة عمليات النشر هذه بسلاسة.

يوضح المثال التالي كيفية تصدير نموذج إلى TFLite مع تمكين تكمية INT8. تتضمن هذه العملية خطوة معايرة حيث يراقب النموذج بيانات العينة لتحديد النطاق الديناميكي الأمثل للقيم المكمية.

from ultralytics import YOLO

# Load a standard YOLO26 model
model = YOLO("yolo26n.pt")

# Export to TFLite format with INT8 quantization
# The 'int8' argument triggers Post-Training Quantization
# 'data' provides the calibration dataset needed for mapping values
model.export(format="tflite", int8=True, data="coco8.yaml")

غالبًا ما يتم نشر النماذج المحسّنة باستخدام معايير قابلة للتشغيل البيني مثل ONNX أو محركات الاستدلال عالية الأداء مثل OpenVINO، مما يضمن توافقًا واسعًا عبر أنظمة الأجهزة المتنوعة.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن