تعرف على كيفية عمل تتبع الكائنات في الرؤية الحاسوبية. اكتشف كيفية استخدام Ultralytics لتحديد ومراقبة الكائنات باستخدام معرفات فريدة للتحليل في الوقت الفعلي.
تتبع الكائنات هو عملية ديناميكية في الرؤية الحاسوبية (CV) تتضمن تحديد كيانات معينة في مقطع فيديو ومراقبة حركتها عبر سلسلة من الإطارات. على عكس تحليل الصور الثابتة، الذي يعامل كل لقطة على حدة، فإن التتبع يضيف بعدًا زمنيًا. وهذا يسمح لأنظمة الذكاء الاصطناعي (AI) بتعيين رقم تعريف فريد (ID) لكل عنصر تم اكتشافه — مثل سيارة أو شخص أو حيوان — والحفاظ على هذه الهوية أثناء تحرك الكائن أو تغيير اتجاهه أو إخفائه مؤقتًا. هذه القدرة هي حجر الزاوية لفهم الفيديو المتقدم، مما يمكّن الآلات من تحليل السلوك وحساب المسارات واستخلاص رؤى قابلة للتنفيذ من اللقطات الأولية.
تستخدم أنظمة التتبع الحديثة عمومًا نموذج "التتبع عن طريق الكشف". يجمع سير العمل هذا بين نماذج الكشف القوية والخوارزميات المتخصصة لربط عمليات الكشف بمرور الوقت. تتبع العملية عادةً ثلاث مراحل رئيسية:
على الرغم من أن هذه المصطلحات وثيقة الصلة ببعضها البعض، إلا أنها تؤدي وظائف متميزة ضمن مسار التعلم الآلي (ML).
تتيح القدرة على الحفاظ على هوية الكائنات تطبيقات استدلال معقدة في الوقت الفعلي عبر مختلف الصناعات.
Ultralytics تنفيذ التتبع عالي الأداء. track الوضع في المكتبة
يتعامل تلقائيًا مع الكشف والتنبؤ بالحركة وتعيين المعرف. يوضح المثال أدناه كيفية استخدام
منصة Ultralytics نموذج YOLO26 المتوافق track في
الفيديو.
from ultralytics import YOLO
# Load the official YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")
# Track objects in a video file or webcam (source=0)
# 'show=True' displays the video with bounding boxes and unique IDs
results = model.track(source="https://ultralytics.com/images/bus.jpg", show=True)
# Access the unique tracking IDs from the results
if results[0].boxes.id is not None:
print(f"Detected Track IDs: {results[0].boxes.id.cpu().numpy()}")
لفهم نظام تتبع الكائنات بشكل كامل، من المفيد استكشاف تجزئة المثيلات، التي تتعقب الخطوط الدقيقة للكائن على مستوى البكسل بدلاً من مجرد مربع. بالإضافة إلى ذلك، غالبًا ما تتضمن تحديات تتبع الكائنات المتعددة (MOT) معايير قياسية مستخدمة على نطاق واسع مثل MOTChallenge لتقييم مدى كفاءة الخوارزميات في التعامل مع المشاهد المزدحمة وحالات الحجب. للنشر في بيئات الإنتاج، غالبًا ما يستخدم المطورون أدوات مثل NVIDIA أو OpenCV لدمج هذه النماذج في خطوط إنتاج فعالة.