مسرد المصطلحات

كاشفات الأجسام ثنائية المراحل

تعرّف على كيفية تحقيق أجهزة الكشف عن الأجسام ذات المرحلتين دقة عالية في اكتشاف الأجسام من خلال مقترحات المناطق والتصنيف وتنقيح المربع المحيط.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

أجهزة الكشف عن الأجسام ذات المرحلتين هي فئة من نماذج الكشف عن الأجسام في الرؤية الحاسوبية التي تقوم بعملية الكشف في خطوتين مختلفتين. في البداية، تُنشئ هذه النماذج مجموعة من مقترحات المناطق، وهي مناطق محتملة في الصورة حيث يمكن أن توجد الأجسام. بعد ذلك، تقوم هذه النماذج بتصنيف كل منطقة مقترحة وتنقيح إحداثيات المربع المحيط بها لتحديد الأجسام بدقة وتحديد موقعها. يتيح هذا النهج المكون من خطوتين دقة أعلى في مهام الكشف عن الأجسام، خاصةً في السيناريوهات المعقدة التي قد تختلف فيها الأجسام من حيث الحجم والاتجاه والمظهر.

كيفية عمل كاشفات الأجسام ثنائية المراحل

يمكن تقسيم تشغيل أجهزة الكشف عن الأجسام ذات المرحلتين إلى مرحلتين رئيسيتين: اقتراح المنطقة وتصنيف المنطقة.

اقتراح المنطقة: في المرحلة الأولى، يحدد النموذج مواقع الكائنات المحتملة داخل الصورة. يتم إنجاز ذلك عادةً باستخدام خوارزميات مثل البحث الانتقائي أو، في الآونة الأخيرة، شبكات اقتراح المناطق (RPNs). شبكات اقتراح المناطق هي نوع من الشبكات العصبية التي تقوم بمسح الصورة لتحديد المناطق التي من المحتمل أن تحتوي على أجسام، وتوليد مربعات محددة حول هذه المناطق.

تصنيف المناطق: تتضمن المرحلة الثانية تصنيف الكائنات داخل المناطق المقترحة وتعديل المربعات المحدودة للحصول على ملاءمة أكثر دقة. يتم تمرير كل منطقة مقترحة من خلال شبكة عصبية تلافيفية (CNN) لاستخراج السمات التي تُستخدم بعد ذلك لتصنيف الكائن وتنقيح إحداثيات المربع الحدودي. تضمن هذه المرحلة تصنيف كل كائن تم اكتشافه وتحديد موقعه بدقة داخل الصورة.

المكونات والتقنيات الرئيسية

تعتبر العديد من المكونات والتقنيات الرئيسية جزءًا لا يتجزأ من عمل أجهزة الكشف عن الأجسام ذات المرحلتين:

شبكات مقترحات المناطق (RPNs): تُعد شبكات اقتراح المناطق ضرورية لتوليد مقترحات مناطق عالية الجودة بكفاءة. تعمل هذه الشبكات عن طريق تمرير شبكة صغيرة على خريطة الملامح الناتجة عن شبكة CNN، والتنبؤ باحتمالية وجود كائن في كل موقع واقتراح تعديلات على المربع المحيط.

استخراج الميزات: يتضمن استخراج الميزات استخدام شبكة CNN، مثل ResNet أو VGG، لاستخراج ميزات ذات معنى من المناطق المقترحة. هذه الميزات ضرورية للتصنيف اللاحق ومهام انحدار الصندوق المحيط.

انحدار الصندوق المحيط: بعد تصنيف الجسم داخل منطقة مقترحة، يتم استخدام انحدار الصندوق المحيط لضبط إحداثيات الصندوق المحيط، مما يضمن ملاءمة محكمة حول الجسم المكتشف.

مقارنة مع أجهزة كشف الأجسام ذات المرحلة الواحدة

غالبًا ما تتم مقارنة أجهزة الكشف عن الأجسام ذات المرحلتين مع أجهزة الكشف عن الأجسام ذات المرحلة الواحدة، مثل Ultralytics YOLO (أنت تنظر مرة واحدة فقط). في حين أن أجهزة الكشف ذات المرحلة الواحدة تقوم بالكشف عن الأجسام في مرور واحد عبر الشبكة، مما يجعلها أسرع وأكثر ملاءمة للتطبيقات في الوقت الفعلي، فإن أجهزة الكشف ذات المرحلتين توفر بشكل عام دقة أعلى بسبب عمليتها المكونة من خطوتين.

الدقة: تحقق أجهزة الكشف ذات المرحلتين عادةً دقة أعلى لأن المرحلة الثانية تسمح بالتحليل التفصيلي والتنقيح لكل منطقة مقترحة. وهذا مفيد بشكل خاص في السيناريوهات ذات الأجسام المتداخلة أو الخلفيات المعقدة.

السرعة: أجهزة الكشف ذات المرحلة الواحدة مثل Ultralytics YOLO أسرع لأنها تعالج الصورة بأكملها في مسار أمامي واحد. أما الكواشف ذات المرحلتين، على الرغم من أنها أكثر دقة، إلا أنها أبطأ بسبب الخطوة الإضافية لمعالجة كل اقتراح منطقة على حدة.

التطبيقات الواقعية

تُستخدم أجهزة الكشف عن الأجسام ثنائية المراحل في مجموعة متنوعة من التطبيقات الواقعية حيث تكون الدقة العالية أمرًا بالغ الأهمية:

المركبات ذاتية القيادة: في السيارات ذاتية القيادة، يعد الاكتشاف الدقيق للمشاة والمركبات والأجسام الأخرى أمراً بالغ الأهمية للملاحة الآمنة. تساعد أجهزة الكشف ذات المرحلتين على ضمان تحديد جميع المخاطر المحتملة بدقة وتحديد موقعها. تعرّف على المزيد حول استخدام الذكاء الاصطناعي في تكنولوجيا القيادة الذاتية.

التصوير الطبي: في مجال الرعاية الصحية، تُستخدم الكواشف ثنائية المراحل لتحليل الصور الطبية، مثل الأشعة السينية والتصوير بالرنين المغناطيسي، للكشف عن الحالات الشاذة مثل الأورام أو الكسور. تُعد الدقة العالية لهذه الكواشف ضرورية للتشخيص الموثوق به وتخطيط العلاج. استكشف المزيد عن الذكاء الاصطناعي والأشعة.

نماذج الكشف عن الأجسام الشائعة ذات المرحلتين

تم تطوير العديد من النماذج المؤثرة استنادًا إلى إطار الكشف على مرحلتين:

R-CNN (المناطق مع ميزات CNN): يستخدم R-CNN أحد النماذج الرائدة في هذه الفئة، يستخدم R-CNN البحث الانتقائي لتوليد مقترحات المناطق وشبكة CNN لتصنيف كل منطقة.

شبكة R-CNN السريعة: وهو تحسين على شبكة R-CNN، حيث تقوم شبكة R-CNN السريعة بمعالجة الصورة بأكملها من خلال شبكة CNN مرة واحدة ثم تستخرج الميزات لكل منطقة مقترحة، مما يسرّع العملية بشكل كبير.

شبكة R-CNN الأسرع: يقدم هذا النموذج شبكة اقتراح المنطقة (RPN)، والتي تدمج توليد اقتراح المنطقة مع شبكة الكشف، مما يزيد من تحسين كل من السرعة والدقة.

للحصول على مزيد من التفاصيل حول بنيات محددة لاكتشاف الأجسام، يمكنك الرجوع إلى مصادر مثل صفحة ويكيبيديا حول اكتشاف الأجسام.

قراءة الكل