مسرد المصطلحات

التدفق البصري

اكتشف قوة التدفق البصري في الرؤية الحاسوبية. تعرّف على كيفية تقدير الحركة، وتعزيز تحليل الفيديو، ودفع الابتكارات في مجال الذكاء الاصطناعي.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

التدفق البصري هو مفهوم مهم في مجال الرؤية الحاسوبية، يشير إلى نمط الحركة الظاهرية للأجسام والأسطح والحواف في مشهد مرئي ناتج عن الحركة النسبية بين الراصد (مثل الكاميرا) والمشهد. تخيل أنك تشاهد مقطع فيديو؛ يحاول التدفق البصري تقدير حركة كل بكسل من إطار إلى آخر، مما يخلق مجال حركة كثيف يصف اتجاه وسرعة الحركة عبر الصورة بأكملها. مجال الحركة هذا لا يُقدَّر بثمن لفهم ديناميكيات المشهد وحركة الأجسام في تسلسلات الفيديو.

فهم التدفق البصري

يعتمد التدفق الضوئي في جوهره على افتراض أن وحدات البكسل التي تنتمي إلى نفس الجسم في إطارات متتالية ستظهر حركة متشابهة. تحلل الخوارزميات التغيرات في كثافة البكسل بمرور الوقت لتقدير متجهات الحركة. تمثّل هذه المتجهات إزاحة البكسلات بين الإطارات، مما يصوّر بفعالية كيفية تحرك الأجزاء المختلفة من الصورة. على الرغم من أن الدقة المثالية تمثل تحدياً بسبب عوامل مثل تغيرات الإضاءة والأسطح الخالية من الملمس والانسدادات، إلا أن التدفق البصري يوفر تقديراً تقريبياً قوياً للحركة في العديد من سيناريوهات العالم الحقيقي.

يختلف التدفق البصري اختلافًا كبيرًا عن اكتشاف الأجسام وتجزئة الصور. فبينما يهدف اكتشاف الأجسام إلى تحديد الأجسام داخل صورة واحدة وتحديد موقعها، وتصنيف تجزئة الصور إلى فئات أجسام، يركز التدفق البصري على الحركة بين الإطارات المتتالية. فهو لا يحدد بالضرورة ما يتحرك، ولكن كيف تتحرك وحدات البكسل في مستوى الصورة بمرور الوقت. وهذا يجعله مفيدًا بشكل خاص للتطبيقات التي يكون فيها فهم ديناميكيات الحركة أمرًا بالغ الأهمية.

تطبيقات التدفق الضوئي

يحتوي التدفق البصري على مجموعة واسعة من التطبيقات، لا سيما في المجالات التي تستفيد من تحليل الفيديو والمعالجة في الوقت الحقيقي. ومن الأمثلة البارزة على ذلك:

  • القيادة الذاتية: في السيارات ذاتية القيادة، يُستخدم التدفق البصري لإدراك حركة الأجسام المحيطة بالنسبة للمركبة. من خلال تحليل مجال التدفق البصري، يمكن للنظام اكتشاف المركبات المتحركة والمشاة والعناصر الديناميكية الأخرى في البيئة، مما يعزز الوعي الظرفي ويتيح التنقل الآمن. هذه المعلومات ضرورية لاتخاذ القرارات في الأنظمة ذاتية القيادة.

  • المراقبة بالفيديو: تستخدم أنظمة الأمن التدفق البصري للكشف عن الحركة والتعرف على الشذوذ. من خلال تحليل أنماط الحركة، يمكن للأنظمة تحديد الأنشطة غير الاعتيادية، مثل الدخلاء أو التغيرات المفاجئة في سلوك الحشود. تتيح هذه الإمكانية اتخاذ تدابير أمنية استباقية ومراقبة فعالة للمناطق الكبيرة. على سبيل المثال، يمكن أن تؤدي أنماط الحركة غير الاعتيادية المكتشفة عبر التدفق البصري إلى إطلاق تنبيهات في نظام إنذار أمني.

بالإضافة إلى هذه الأمثلة، يُستخدم التدفق البصري أيضًا في علم الروبوتات من أجل التعرّف على الحركة البصرية (التعريب والتخطيط المتزامن)، وفي ضغط الفيديو لتقدير متجهات الحركة من أجل ترميز فعال، وفي أشكال مختلفة من تحليل الفيديو مثل التعرف على الحركة وتحرير الفيديو. مع استمرار تقدم الرؤية الحاسوبية، يظل التدفق البصري تقنية أساسية لفهم الحركة وتفسيرها في البيانات المرئية وتفسيرها، مكملاً لنماذج قوية مثل Ultralytics YOLOv8 لفهم المشهد بشكل شامل. ويجري أيضًا استكشاف المزيد من التطورات في التعلم العميق لتعزيز تقدير التدفق البصري، ودمجه مع نماذج لتحسين تتبع الأجسام وتحليل المشهد.

قراءة الكل