Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

الاستدلال في الوقت الفعلي

اكتشف قوة الاستدلال في الوقت الفعلي للتنبؤات الفورية بالذكاء الاصطناعي. تعرف على كيفية تقديم Ultralytics نتائج منخفضة التأخير للأجهزة الطرفية والروبوتات.

يشير الاستدلال في الوقت الفعلي إلى العملية التي يقبل فيها نموذج التعلم الآلي (ML) المدرب البيانات المدخلة الحية ويقوم بتوليد تنبؤات بشكل فوري تقريبًا. على عكس المعالجة غير المتصلة بالإنترنت، حيث يتم جمع البيانات وتحليلها بشكل مجمّع في وقت لاحق، يحدث الاستدلال في الوقت الفعلي بشكل فوري، مما يمكّن الأنظمة من الاستجابة لبيئتها بسرعة ورشاقة. هذه القدرة هي جوهر تطبيقات الذكاء الاصطناعي (AI) الحديثة، حيث تسمح للأجهزة بإدراك البيانات وتفسيرها والتصرف بناءً عليها في غضون أجزاء من الثانية.

أهمية الكمون المنخفض

المقياس الأساسي لتقييم الأداء في الوقت الفعلي هو زمن انتظار الاستدلال. يقيس هذا المقياس الفارق الزمني بين لحظة إدخال البيانات في النموذج — مثل إطار من كاميرا فيديو — ولحظة إنتاج النموذج لناتج، مثل مربع حدودي أو تسمية تصنيف. لكي يعتبر التطبيق "في الوقت الفعلي"، يجب أن يكون زمن الانتظار منخفضًا بدرجة كافية لتتناسب مع سرعة تدفق البيانات الواردة.

على سبيل المثال، في مهام فهم الفيديو التي تعمل بسرعة 30 إطارًا في الثانية (FPS)، يتمتع النظام بميزانية زمنية صارمة تبلغ حوالي 33 مللي ثانية لمعالجة كل إطار. إذا استغرق الاستدلال وقتًا أطول، فإن النظام يحدث تأخيرًا، مما قد يؤدي إلى فقدان الإطارات أو تأخير الاستجابات. لتحقيق ذلك، غالبًا ما يتطلب الأمر تسريع الأجهزة باستخدام وحدات معالجة الرسومات (GPU) أو أجهزة Edge AI المتخصصة مثل NVIDIA .

الاستدلال في الوقت الحقيقي مقابل الاستدلال الدفعي

من المفيد التمييز بين سير العمل في الوقت الحقيقي و المعالجة المجمعة. على الرغم من أن كلاهما ينطوي على إنشاء تنبؤات، إلا أن أهدافهما وبنيتهما تختلفان بشكل كبير:

  • الاستدلال في الوقت الفعلي: يعطي الأولوية للكمون المنخفض. يعالج نقاط البيانات الفردية (أو الدفعات الصغيرة جدًا) بمجرد وصولها. وهذا أمر ضروري للتطبيقات التفاعلية مثل المركبات ذاتية القيادة، حيث يجب على السيارة detect على الفور للفرملة في الوقت المناسب.
  • الاستدلال الدفعي: يعطي الأولوية للإنتاجية العالية. يجمع كمية كبيرة من البيانات ويعالجها دفعة واحدة. وهذا مناسب للمهام غير العاجلة، مثل إنشاء تقارير المخزون الليلية أو تحليل اتجاهات البيانات الضخمة التاريخية.

تطبيقات واقعية

أدت القدرة على اتخاذ قرارات في أجزاء من الثانية إلى تغيير العديد من الصناعات من خلال تمكين الأتمتة في البيئات الديناميكية .

  • التصنيع الذكي: في الذكاء الاصطناعي في التصنيع، تستخدم الكاميرات الموضوعة فوق السير الناقل الاستدلال في الوقت الفعلي لإجراء مراقبة الجودة الآلية. يمكن لنموذج الكشف عن الأجسام أن يحدد على الفور العيوب أو الأجسام الغريبة في المنتجات التي تتحرك بسرعات عالية. إذا تم الكشف عن أي شذوذ، يقوم النظام بتشغيل ذراع آلي لإزالة العنصر على الفور، مما يضمن وصول المنتجات عالية الجودة فقط إلى التعبئة والتغليف.
  • المراقبة والأمن: تعتمد أنظمة الأمن الحديثة على الرؤية الحاسوبية لمراقبة المحيط. بدلاً من مجرد تسجيل اللقطات، تعمل هذه الكاميرات في الوقت الفعلي على اكتشاف الأشخاص أو التعرف على الوجوه لتنبيه أفراد الأمن بالدخول غير المصرح به في اللحظة التي يحدث فيها.
  • الروبوتات: في مجال الذكاء الاصطناعي في الروبوتات، تستخدم الروبوتات تقدير الوضع للتنقل في المساحات المادية المعقدة. يجب أن يستنتج روبوت المستودع باستمرار موقع العوائق والعاملين البشريين لتخطيط مساره بأمان وكفاءة.

التحسين والنشر

غالبًا ما يتطلب نشر النماذج للتطبيقات في الوقت الفعلي تحسينًا لضمان تشغيلها بكفاءة على الأجهزة المستهدفة . تقنيات مثل تكمية النموذج تقلل من دقة أوزان النموذج (على سبيل المثال، من float32 إلى int8) لتقليل استخدام الذاكرة وزيادة سرعة الاستدلال مع تأثير ضئيل على الدقة.

يمكن للمطورين استخدام Ultralytics لتبسيط هذه العملية. تعمل المنصة على تبسيط التدريب وتسمح للمستخدمين بتصدير النماذج إلى تنسيقات محسّنة مثل TensorRTNVIDIA OpenVINO لمعالجات Intel ، أو TFLite للنشر على الأجهزة المحمولة.

مثال على الرمز

يوضح Python التالي Python كيفية تشغيل الاستدلال في الوقت الفعلي على بث كاميرا الويب باستخدام ultralytics مكتبة. وهي تستخدم يولو26 نموذج Nano ، الذي تم تصميمه خصيصًا لتحقيق أداء عالي السرعة على الأجهزة المتطورة.

from ultralytics import YOLO

# Load the YOLO26 Nano model, optimized for speed and real-time tasks
model = YOLO("yolo26n.pt")

# Run inference on the default webcam (source="0")
# 'stream=True' returns a generator for memory-efficient processing
# 'show=True' displays the video feed with bounding boxes in real-time
results = model.predict(source="0", stream=True, show=True)

# Iterate through the generator to process frames as they arrive
for result in results:
    # Example: Print the number of objects detected in the current frame
    print(f"Detected {len(result.boxes)} objects")

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن