Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

تتبع الأجسام

تعرف على كيفية عمل تتبع الكائنات في الرؤية الحاسوبية. اكتشف كيفية استخدام Ultralytics لتحديد ومراقبة الكائنات باستخدام معرفات فريدة للتحليل في الوقت الفعلي.

تتبع الكائنات هو عملية ديناميكية في الرؤية الحاسوبية (CV) تتضمن تحديد كيانات معينة في مقطع فيديو ومراقبة حركتها عبر سلسلة من الإطارات. على عكس تحليل الصور الثابتة، الذي يعامل كل لقطة على حدة، فإن التتبع يضيف بعدًا زمنيًا. وهذا يسمح لأنظمة الذكاء الاصطناعي (AI) بتعيين رقم تعريف فريد (ID) لكل عنصر تم اكتشافه — مثل سيارة أو شخص أو حيوان — والحفاظ على هذه الهوية أثناء تحرك الكائن أو تغيير اتجاهه أو إخفائه مؤقتًا. هذه القدرة هي حجر الزاوية لفهم الفيديو المتقدم، مما يمكّن الآلات من تحليل السلوك وحساب المسارات واستخلاص رؤى قابلة للتنفيذ من اللقطات الأولية.

كيفية عمل تتبع الأجسام

تستخدم أنظمة التتبع الحديثة عمومًا نموذج "التتبع عن طريق الكشف". يجمع سير العمل هذا بين نماذج الكشف القوية والخوارزميات المتخصصة لربط عمليات الكشف بمرور الوقت. تتبع العملية عادةً ثلاث مراحل رئيسية:

  1. الكشف: في كل إطار، يقوم نموذج الكشف عن الكائنات ، مثل نموذج YOLO26 المتطور، بمسح الصورة لتحديد مواقع الكائنات المهمة. ينتج النموذج مربعات حدودية تحدد النطاق المكاني لكل كائن.
  2. توقع الحركة: تقدر خوارزميات مثل مرشح كالمان الموضع المستقبلي لجسم ما بناءً على سرعته الحالية ومساره. يقلل هذا التوقع من مساحة البحث للإطار التالي، مما يجعل النظام أكثر كفاءة.
  3. ربط البيانات: يقوم النظام بمطابقة الاكتشافات الجديدة مع المسارات الموجودة باستخدام طرق التحسين مثل الخوارزمية المجرية. تعتمد هذه الخطوة غالبًا على مقاييس مثل التقاطع فوق الاتحاد (IoU) لقياس مدى تداخل المربع المتوقع مع الاكتشاف الجديد. قد تستخدم أجهزة التتبع المتقدمة أيضًا استخراج الميزات المرئية لإعادة تحديد الكائنات التي تبدو متشابهة.

تتبع الكائنات مقابل اكتشاف الكائنات

على الرغم من أن هذه المصطلحات وثيقة الصلة ببعضها البعض، إلا أنها تؤدي وظائف متميزة ضمن مسار التعلم الآلي (ML).

  • يجاوب اكتشاف الأشياء على السؤال: "ماذا موجود في هذه الصورة وأين؟" وهو غير مرتبط بالسياق، أي أنه لا يحتفظ بذاكرة للإطارات السابقة. إذا مرت سيارة في مقطع فيديو، يرى جهاز الكشف "سيارة" في الإطار 1 و"سيارة" في الإطار 2، لكنه لا يعرف أنهما نفس السيارة.
  • تتبع الكائنات يجيب على السؤال "أين يتجه هذا الكائن المحدد ؟" وهو حالة. يربط "السيارة" في الإطار 1 بـ "السيارة" في الإطار 2، مما يسمح للنظام بتسجيل أن "رقم السيارة 42" يتحرك من اليسار إلى اليمين. وهذا ضروري لمهام مثل النمذجة التنبؤية والعد.

تطبيقات واقعية

تتيح القدرة على الحفاظ على هوية الكائنات تطبيقات استدلال معقدة في الوقت الفعلي عبر مختلف الصناعات.

  • أنظمة النقل الذكية: يعد التتبع أمرًا حيويًا للمركبات ذاتية القيادة للتنقل بأمان. من خلال تتبع المشاة والمركبات الأخرى، يمكن للسيارات توقع الاصطدامات المحتملة. علاوة على ذلك، يستخدم مهندسو المرور هذه الأنظمة لتقدير السرعة من أجل فرض لوائح السلامة وتحسين تدفق حركة المرور.
  • تحليلات البيع بالتجزئة: تستخدم المتاجر التقليدية الذكاء الاصطناعي في البيع بالتجزئة لفهم سلوك العملاء. يتيح التتبع لمديري المتاجر إجراء عد الأغراض لقياس حركة الزوار، وتحليل أوقات البقاء أمام العروض باستخدام خرائط الحرارة، و تحسين إدارة الطوابير لتقليل أوقات الانتظار.
  • تحليل الرياضة: في الرياضات الاحترافية، يستخدم المدربون التتبع جنبًا إلى جنب مع تقدير الوضع لتحليل الميكانيكا الحيوية للاعبين وتشكيلات الفريق. توفر هذه البيانات ميزة تنافسية من خلال الكشف عن أنماط غير مرئية للعين المجردة.

تنفيذ التتبع باستخدام Python

Ultralytics تنفيذ التتبع عالي الأداء. track الوضع في المكتبة يتعامل تلقائيًا مع الكشف والتنبؤ بالحركة وتعيين المعرف. يوضح المثال أدناه كيفية استخدام منصة Ultralytics نموذج YOLO26 المتوافق track في الفيديو.

from ultralytics import YOLO

# Load the official YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")

# Track objects in a video file or webcam (source=0)
# 'show=True' displays the video with bounding boxes and unique IDs
results = model.track(source="https://ultralytics.com/images/bus.jpg", show=True)

# Access the unique tracking IDs from the results
if results[0].boxes.id is not None:
    print(f"Detected Track IDs: {results[0].boxes.id.cpu().numpy()}")

المفاهيم ذات الصلة

لفهم نظام تتبع الكائنات بشكل كامل، من المفيد استكشاف تجزئة المثيلات، التي تتعقب الخطوط الدقيقة للكائن على مستوى البكسل بدلاً من مجرد مربع. بالإضافة إلى ذلك، غالبًا ما تتضمن تحديات تتبع الكائنات المتعددة (MOT) معايير قياسية مستخدمة على نطاق واسع مثل MOTChallenge لتقييم مدى كفاءة الخوارزميات في التعامل مع المشاهد المزدحمة وحالات الحجب. للنشر في بيئات الإنتاج، غالبًا ما يستخدم المطورون أدوات مثل NVIDIA أو OpenCV لدمج هذه النماذج في خطوط إنتاج فعالة.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن