اكتشف كيف تُحدِث أجهزة الكشف القائمة على المرساة ثورة في اكتشاف الأجسام من خلال تحديد الموقع الدقيق، والقدرة على التكيف على نطاق واسع، والتطبيقات الواقعية.
تمثل أجهزة الكشف المستندة إلى المرساة نهجًا مهمًا وأساسيًا في الرؤية الحاسوبية (CV) لمعالجة مهمة الكشف عن الأجسام. تعمل هذه النماذج باستخدام مجموعة محددة مسبقًا من المربعات المرجعية، والتي يُشار إليها عادةً باسم "المراسي" أو "المسبقين"، والتي لها أحجام ونسب أبعاد محددة. يتم توزيع نقاط الارتكاز عبر الصورة وتعمل كتخمينات أو قوالب أولية، مما يمكّن النموذج من التنبؤ بشكل أكثر فعالية بموقع وفئة الأجسام، خاصة عند التعامل مع عناصر ذات مقاييس وأشكال مختلفة. العديد من نماذج اكتشاف الأجسام المبكرة المؤثرة، مثل بعض إصدارات Ultralytics YOLO باستخدام هذه التقنية.
يتمثّل المفهوم الأساسي وراء أجهزة الكشف القائمة على المرساة في تراكب شبكة كثيفة من مربعات الارتساء المحددة مسبقًا عبر صورة الإدخال في مواقع ومقاييس متعددة. يتوافق كل مربع تثبيت مع جسم محتمل بحجم وشكل محددين. أثناء عملية تدريب النموذج، يتعلم الكاشف أمرين أساسيين لكل مرساة: أولاً، يصنف ما إذا كان صندوق المرساة يحتوي على جسم أو خلفية ذات صلة؛ ثانياً، يقوم بتحسين موضع المرساة وأبعادها (عملية تسمى الانحدار) لتتناسب بدقة مع الصندوق المحيط بالجسم الفعلي.
ضع في اعتبارك اكتشاف المركبات المختلفة في صورة لشارع مزدحم. بدلاً من تحليل كل مجموعة بكسل، يستخدم النموذج المستند إلى نقطة الارتكاز قوالب مربعات محددة مسبقاً: مربعات صغيرة للمشاة، ومربعات متوسطة الحجم للسيارات، ومستطيلات أكبر للحافلات. يتم وضع هذه القوالب (المراسي) عبر الصورة. إذا تداخلت إحدى المراسي بشكل كبير مع سيارة، يتعلم النموذج تصنيفها على أنها "سيارة" ويضبط إحداثيات المرساة وحجمها لتناسب السيارة بشكل مثالي. يتم تصنيف المراسي التي تغطي الطريق أو المباني فقط على أنها "خلفية". يساعد هذا النهج المنهجي، الذي يسترشد بأشكال محددة مسبقًا، في إدارة تعقيد عملية اكتشاف الأجسام. عادةً ما يتم تقييم الأداء باستخدام مقاييس مثل التقاطع على الاتحاد (IoU) ومتوسط متوسط الدقة (mAP).
تقدم أجهزة الكشف المستندة إلى المرساة، والتي غالبًا ما تستفيد من الشبكات العصبية التلافيفية القوية (CNNs) كعمودها الفقري، مزايا متميزة:
تم نشر أجهزة الكشف القائمة على المرساة بنجاح في العديد من سيناريوهات العالم الحقيقي:
في السنوات الأخيرة، برزت أجهزة الكشف الخالية من المراسي كبديل شائع. على عكس النماذج القائمة على المرساة (على سبيل المثال, Ultralytics YOLOv5)، تتنبأ النُهج الخالية من المرتكزات بمواقع الأجسام وأحجامها مباشرةً، وغالبًا ما يتم ذلك عن طريق تحديد النقاط الرئيسية (مثل مراكز الأجسام أو زواياها) أو التنبؤ بالمسافات من نقطة إلى حدود الجسم، مما يلغي الحاجة إلى أشكال مرتكزات محددة مسبقًا.
تشمل الاختلافات الرئيسية ما يلي:
في حين أن أجهزة الكشف القائمة على الارتكاز مثل YOLOv4 كانت ناجحة للغاية، فإن العديد من البنى الحديثة، بما في ذلك Ultralytics YOLO11، قد اعتمدت تصميمات خالية من المراسي للاستفادة من مزاياها في البساطة والكفاءة. يمكنك استكشاف مزايا الكشف الخالي من المراسي في YOLO11 والاطلاع على المقارنات بين نماذج YOLO المختلفة.
يتضمن تطوير نماذج اكتشاف الكائنات ونشرها، سواء كانت قائمة على المرساة أو خالية من المرساة، استخدام أطر عمل مثل PyTorch أو TensorFlow ومكتبات مثل OpenCV. وتوفر منصات مثل Ultralytics HUB تدفقات عمل مبسطة لتدريب النماذج المخصصة وإدارة مجموعات البيانات ونشر الحلول، ودعم مختلف بنيات النماذج. ولمزيد من التعلّم، تسرد موارد مثل Papers With Code أحدث النماذج، وتغطي الدورات التدريبية من منصات مثل DeepLearning.AI المفاهيم الأساسية.