اكتشف دقة أجهزة الكشف عن الأجسام ذات المرحلتين في الرؤية الحاسوبية، وهي مثالية للمهام التي تتطلب دقة عالية في المركبات ذاتية القيادة وتصوير الرعاية الصحية.
تُعد أجهزة الكشف عن الأجسام ذات المرحلتين نهجًا بارزًا في مجال الرؤية الحاسوبية، وهي معروفة بشكل خاص بدقتها في مهام مثل اكتشاف وتحديد الأجسام المختلفة داخل الصورة. تعمل هذه الأنظمة من خلال تقسيم عملية الكشف إلى مرحلتين متسلسلتين، مما يوفر طريقة مفصلة وقوية لتحديد الأجسام بدقة أعلى مقارنةً بأجهزة الكشف عن الأجسام ذات المرحلة الواحدة.
تبدأ العملية بالمرحلة الأولى التي تولد مناطق الاهتمام المحتملة (ROIs) في الصورة. تستخدم هذه المرحلة تقنيات لتحديد المناطق التي يُحتمل أن تحتوي على أجسام دون تحديد الأجسام نفسها. تتضمن الطرق الشائعة شبكات اقتراح المناطق (RPNs) التي توفر مواقع الأجسام المرشحة بكفاءة.
في المرحلة الثانية، يقوم الكاشف بتنقيح هذه المقترحات من خلال تصنيف المناطق المحددة وتعديل حدودها لتلائم الكائنات بشكل أفضل. تتضمن عملية التنقيح تحليلاً أكثر تفصيلاً باستخدام شبكة عصبية تلافيفية (CNN) لتصنيف الكائن وتحديد حدوده بشكل أكبر.
في حين يتم تقييم أجهزة الكشف ذات المرحلتين لدقتها، إلا أنها تميل إلى أن تكون أبطأ من أجهزة الكشف عن الأجسام ذات المرحلة الواحدة مثل عائلة Ultralytics YOLO . تتخطى أجهزة الكشف ذات المرحلة الواحدة مرحلة اقتراح عائد الاستثمار وتقوم بعمل تنبؤات مباشرةً على عينات كثيفة من مواقع الأجسام المحتملة. يمكن أن تكون هذه الطريقة المباشرة أسرع ولكنها قد تضحي ببعض الدقة، مما يجعل أجهزة الكشف ذات المرحلتين مفضلة للتطبيقات التي تكون فيها الدقة ضرورية.
شبكة R-CNN ومتغيراتها: مهدت شبكة R-CNN الأصلية (الشبكة العصبية التلافيفية القائمة على المنطقة) الطريق لنماذج أسرع مثل شبكة R-CNN السريعة وشبكة R-CNN الأسرع، حيث يعمل كل منها على تحسين السرعة والدقة. تُستخدم شبكة R-CNN الأسرع بشكل شائع في السيناريوهات التي يتم فيها إعطاء الأولوية للدقة، مثل التصوير الطبي أو تكنولوجيا المركبات ذاتية القيادة.
قناع R-CNN: امتداد لـ Faster R-CNN، لا يكتشف Mask R-CNN الكائنات فحسب، بل يوفر أيضًا قناعًا على مستوى البكسل لكل كائن. يُستخدم على نطاق واسع في الحالات التي تتطلب تجزئة النسخ بما يتجاوز مجرد الكشف عن الكائنات، كما هو الحال في صناعة الأزياء لوضع علامات على الملابس آليًا(استكشف Mask R-CNN).
في السيارات ذاتية القيادة، يتم استخدام أجهزة الكشف على مرحلتين لتحديد المشاة وراكبي الدراجات والمركبات بدقة عالية، مما يضمن السلامة والالتزام بقواعد الطرق. ويعتمد الذكاء الاصطناعي في السيارات ذاتية القيادة اعتماداً كبيراً على هذه الكواشف في أنظمة اتخاذ القرار.
تلعب أجهزة الكشف عن الأجسام ثنائية المراحل دورًا أساسيًا في تحليل الصور الطبية، مما يساعد على تحديد الأورام أو الكسور أو الحالات الحرجة الأخرى بدقة. في مجال الرعاية الصحية، حيث الدقة أمر حيوي، تسهّل هذه النماذج عمليات التشخيص والنتائج بشكل أفضل. يعرض الذكاء الاصطناعي البصري في مجال الرعاية الصحية تطبيقات مختلفة تُحدث تحولاً في المجال الطبي.
مع التقدم في مجال الذكاء الاصطناعي والتعلم الآلي، أصبحت أجهزة الكشف عن الأجسام ثنائية المراحل مدمجة بشكل متزايد مع تقنيات أخرى مثل التعلم التحويلي وأخلاقيات الذكاء الاصطناعي. ويسمح التكامل مع منصات مثل Ultralytics HUB بالتدريب والنشر السلسين، مما يجعل الكشف عن الأجسام المتطور متاحاً لجمهور أوسع.
يبدو مستقبل اكتشاف الأجسام على مرحلتين واعداً مع التحسينات المستمرة في كفاءة الخوارزمية وقدرات الأجهزة. ويضمن هذا التقدم أنها ستظل جزءًا أساسيًا من الحلول القائمة على الذكاء الاصطناعي في مختلف المجالات المعقدة. بالنسبة للمهتمين بالاستفادة من هذه التقنيات، يمكن أن يوفر استكشاف موارد وحلول Ultralytics' دعماً وإرشاداً كبيرين.