كاشفات الأجسام ثنائية المراحل

اكتشف قوة أجهزة الكشف عن الأجسام ذات المرحلتين - حلول تركز على الدقة لاكتشاف الأجسام بدقة في مهام الرؤية الحاسوبية المعقدة.

كاشفات الأجسام ذات المرحلتين هي فئة من نماذج الرؤية الحاسوبية التي تحدد الأجسام في الصورة أو الفيديو وتحدد موقعها من خلال عملية متسلسلة من خطوتين. تُعرف هذه المنهجية بدقتها العالية، لا سيما في تحديد مواقع الأجسام بدقة، على الرغم من أنها غالبًا ما تأتي على حساب زمن استنتاج أعلى. تتمثل الفكرة الأساسية في تحديد المناطق المحتملة ذات الأهمية أولاً ثم إجراء تصنيف مفصّل وتحديد موقع تلك المناطق الواعدة فقط.

العملية ذات المرحلتين

ينقسم تشغيل الكاشف ذي المرحلتين إلى مرحلتين مختلفتين ومتتابعتين:

توليد مقترحات المناطق: في المرحلة الأولى، يقوم النموذج بمسح الصورة لتوليد مجموعة من المناطق المرشحة، والمعروفة باسم "مناطق الاهتمام" (RoIs) أو المقترحات، والتي من المحتمل أن تحتوي على كائن ما. يتم إنجاز ذلك عادةً بواسطة وحدة فرعية تُسمى شبكة مقترحات المناطق (RPN)، كما هو مشهور في بنية شبكة R-CNN الأسرع. الهدف من هذه المرحلة ليس تصنيف الكائنات ولكن ببساطة تقليل عدد المواقع التي تحتاج المرحلة الثانية إلى تحليلها.
تصنيف الكائنات وتنقيح مربع الحدود: في المرحلة الثانية، يتم تمرير كل منطقة مقترحة إلى رأس تصنيف ورأس انحدار. يحدّد رأس التصنيف فئة الكائن داخل منطقة الروي (على سبيل المثال، "شخص" أو "سيارة" أو "كلب") أو يعيّنه كخلفية. في الوقت نفسه، يقوم رأس الانحدار بتحسين إحداثيات المربع المحيط لتتناسب مع الكائن بشكل أكثر دقة. يسمح هذا التحليل المركّز للمناطق المحددة مسبقًا للنموذج بتحقيق دقة توطين عالية.

أجهزة الكشف ذات المرحلتين مقابل أجهزة الكشف ذات المرحلة الواحدة

يكمن الفرق الأساسي في خط سيرها التشغيلي. تفصل أجهزة الكشف ذات المرحلتين بين مهمتي تحديد الموقع والتصنيف، في حين أن أجهزة الكشف عن الأجسام ذات المرحلة الواحدة تؤدي المهمتين في وقت واحد في مسار واحد.

أجهزة الكشف ذات المرحلتين (مثل عائلة R-CNN): إعطاء الأولوية للدقة. تسمح العملية المكونة من خطوتين باستخراج ميزات أكثر تفصيلاً وتنقيحًا لكل كائن محتمل، مما يؤدي إلى أداء أفضل في المشاهد المعقدة التي تحتوي على العديد من الكائنات الصغيرة أو المتداخلة. ومع ذلك، فإن تعقيدها يجعلها مكثفة حسابيًا وأبطأ.
كاشفات المرحلة الواحدة (على سبيل المثال، Ultralytics YOLO، SSD): إعطاء الأولوية للسرعة والكفاءة. من خلال التعامل مع اكتشاف الكائنات كمشكلة انحدار واحدة، فإنها تحقق سرعات استدلال في الوقت الفعلي مناسبة للتطبيقات على أجهزة الذكاء الاصطناعي المتطورة. على الرغم من أن النماذج الحديثة ذات المرحلة الواحدة مثل YOLO11 قد أغلقت فجوة الدقة بشكل كبير، إلا أن أجهزة الكشف ذات المرحلتين قد تظل مفضلة للمهام التي تتطلب أعلى دقة ممكنة.

المعماريات البارزة

تميز تطور أجهزة الكشف ذات المرحلتين بالعديد من النماذج المؤثرة:

R-CNN (الشبكة العصبية التلافيفية القائمة على المنطقة): النموذج الرائد الذي اقترح لأول مرة استخدام مقترحات المنطقة مع الشبكة العصبية التلافيفية (CNN). استخدم خوارزمية خارجية تسمى البحث الانتقائي لتوليد المقترحات.
شبكة R-CNN السريعة: تحسين يعالج الصورة بأكملها من خلال شبكة CNN مرة واحدة، مما يؤدي إلى مشاركة العمليات الحسابية وتسريع العملية بشكل كبير.
شبكة R-CNN أسرع: تقديم شبكة اقتراح المنطقة (RPN)، ودمج آلية اقتراح المنطقة في الشبكة العصبية نفسها للحصول على حل تعلم عميق شامل.
قناع R-CNN: يوسّع شبكة R-CNN الأسرع عن طريق إضافة فرع ثالث يُخرج قناعًا على مستوى البكسل لكل كائن، مما يتيح تجزئة المثيل.

التطبيقات الواقعية

إن الدقة العالية لأجهزة الكشف ذات المرحلتين تجعلها ذات قيمة في السيناريوهات التي تكون فيها الدقة أمرًا بالغ الأهمية:

تحليل الصور الطبية: يتطلب الكشف عن الحالات الشاذة الدقيقة مثل الأورام الصغيرة أو الآفات أو الأورام الحميدة في الفحوصات الطبية (التصوير المقطعي المحوسب والتصوير بالرنين المغناطيسي) دقة عالية للمساعدة في التشخيص. يعد التوطين الدقيق أمرًا بالغ الأهمية لتخطيط العلاج. اطلع على المزيد عن الذكاء الاصطناعي في مجال الرعاية الصحية والأبحاث في مجلات مثل Radiology: الذكاء الاصطناعي. يمكنك استكشاف مجموعات بيانات مثل مجموعة بيانات أورام الدماغ للمهام ذات الصلة.
القيادة الذاتية: يُعد الاكتشاف الدقيق للمشاة وراكبي الدراجات والمركبات الأخرى وإشارات المرور وتحديد مواقعها بدقة، خاصةً الصغيرة أو المحجوبة جزئياً، أمراً بالغ الأهمية لأنظمة السلامة في السيارات ذاتية القيادة. تعتمد شركات مثل Waymo بشكل كبير على أنظمة الإدراك القوية.
فهم تفصيلي للمشهد: التطبيقات التي تتطلب فهماً دقيقاً لتفاعلات الكائنات أو العد الدقيق تستفيد من الدقة العالية.
مراقبة الجودة في التصنيع: غالبًا ما يتطلب تحديد العيوب الصغيرة أو التحقق من وضع المكونات في التجميعات المعقدة دقة عالية. تعرف على المزيد حول الذكاء الاصطناعي في التصنيع.

وعادةً ما يتضمن تدريب هذه النماذج مجموعات بيانات موسومة كبيرة، مثل مجموعة بيانات COCO، والضبط الدقيق. توفر Ultralytics موارد لتدريب النماذج وفهم مقاييس الأداء. بينما يركز Ultralytics على النماذج الفعالة ذات المرحلة الواحدة مثل Ultralytics YOLO، فإن فهم النماذج الكاشفة ذات المرحلتين يوفر سياقًا قيّمًا في المجال الأوسع لاكتشاف الأجسام.

كاشفات الأجسام ثنائية المراحل

حل الترخيص المرن للمؤسسات لتعزيز ابتكاراتك

تدريب نماذج الذكاء الاصطناعي في ثوانٍ مع Ultralytics YOLO

تدريب نماذج YOLO ببساطة باستخدام Ultralytics HUB

العملية ذات المرحلتين

أجهزة الكشف ذات المرحلتين مقابل أجهزة الكشف ذات المرحلة الواحدة

المعماريات البارزة

التطبيقات الواقعية

اقرأ المزيد في هذه الفئة

تطور الروبوتات ومستقبلها في التصنيع

عزز المراقبة الذكية مع Ultralytics YOLO11

دليل حول بنية شبكة U-Net وتطبيقاتها

انضم إلى مجتمع Ultralytics