اكتشف كيف تُحدِث أجهزة الكشف القائمة على المرساة ثورة في اكتشاف الأجسام من خلال تحديد الموقع الدقيق، والقدرة على التكيف على نطاق واسع، والتطبيقات الواقعية.
تمثل أجهزة الكشف المستندة إلى المرساة نهجًا أساسيًا في الرؤية الحاسوبية (CV) لإجراء الكشف عن الأجسام. وتعتمد هذه النماذج على مجموعة من المربعات المرجعية المحددة مسبقًا، والمعروفة باسم "المراسي" أو "المسبقين"، والتي لها أحجام ونسب أبعاد محددة. تعمل نقاط الارتكاز هذه كنقاط بداية أو قوالب عبر الصورة، مما يساعد النموذج على التنبؤ بموقع وفئة الأجسام المحتملة بشكل أكثر فعالية، خاصة تلك التي تختلف بشكل كبير في الحجم والشكل. استخدمت العديد من البنى الناجحة السابقة للكشف عن الأجسام هذه الطريقة.
تتضمن الفكرة الأساسية وراء أجهزة الكشف المستندة إلى المرساة وضع شبكة كثيفة من مربعات الارتساء عبر صورة الإدخال في مواقع مختلفة. يمثّل كل مربع مرساة كائنًا محتملًا مرشحًا بمقياس محدد مسبقًا ونسبة عرض إلى ارتفاع. أثناء عملية التدريب، يتعلم النموذج أمرين رئيسيين لكل مرساة: أولاً، ما إذا كانت المرساة تحتوي على كائن ذي صلة (التصنيف)، وثانياً، كيفية ضبط موضع المرساة وأبعادها (الانحدار) لتتناسب بإحكام مع المربع المحيط بالكائن الفعلي.
تخيل البحث عن مركبات مختلفة في صورة موقف سيارات كبير. بدلاً من المسح الضوئي بكسل تلو الآخر، يمكنك استخدام قوالب مستطيلة محددة مسبقاً (نقاط ارتكاز): قوالب رأسية صغيرة للدراجات النارية، وقوالب متوسطة مربعة الشكل للسيارات، وقوالب كبيرة عريضة للحافلات. يمكنك تراكب هذه القوالب عبر الصورة. عندما يتداخل القالب بشكل كبير مع سيارة، يتعلم النموذج تأكيد "نعم، هذه سيارة" ويغير القالب قليلاً ويغير حجمه ليتطابق مع حدود السيارة بشكل مثالي. يتم تصنيف القوالب التي تغطي في الغالب الخلفية على هذا النحو. تغطي هذه الطريقة الاحتمالات بشكل منهجي، مسترشدة بالأشكال المحددة مسبقاً. يُقاس الأداء غالبًا باستخدام مقاييس مثل التقاطع على الاتحاد (IoU) ومتوسط متوسط الدقة (mAP).
تقدم أجهزة الكشف القائمة على المرساة، والتي غالبًا ما تكون مبنية على الشبكات العصبية التلافيفية (CNNs)، العديد من الخصائص البارزة:
يتمثل أحد التطورات المهمة في مجال اكتشاف الأجسام في ظهور أجهزة الكشف الخالية من المرتكزات. على عكس النماذج القائمة على المرساة (على سبيل المثال، YOLOv4)، تتنبأ الطرق الخالية من المرساة بمواقع الأجسام وأحجامها مباشرة، وغالبًا ما يتم ذلك عن طريق تحديد النقاط الرئيسية (مثل الزوايا أو المراكز) أو التنبؤ بالمسافات من نقطة إلى حدود الجسم، دون الاعتماد على أشكال مرساة محددة مسبقًا.
تشمل الفروق الرئيسية ما يلي:
النماذج الحديثة مثل Ultralytics YOLO11 تستخدم أساليب خالية من الارتكاز، وتستفيد من مزاياها في الكفاءة والبساطة. يمكنك قراءة المزيد حول مزايا الاكتشاف الخالي من المراسي في YOLO11.
على الرغم من الاتجاه نحو الأساليب الخالية من المرساة، فقد تم نشر أجهزة الكشف القائمة على المرساة بنجاح في العديد من التطبيقات:
في الوقت الذي تكتسب فيه الأساليب الخالية من المرتكزات شعبية، فإن فهم أجهزة الكشف القائمة على المرتكزات أمر ضروري لتقدير تطور اكتشاف الأجسام واستمرار أهميتها في سياقات محددة أو أنظمة قديمة. أدوات مثل PyTorch و TensorFlow تدعم كلاً من تطوير النماذج القائمة على المرساة والنماذج الخالية من المرساة، بينما تعمل منصات مثل Ultralytics HUB على تبسيط تدريب ونشر أجهزة الكشف الحديثة.