مسرد المصطلحات

أجهزة الكشف القائمة على المرساة

اكتشف كيف تُحدِث أجهزة الكشف القائمة على المرساة ثورة في اكتشاف الأجسام من خلال تحديد الموقع الدقيق، والقدرة على التكيف على نطاق واسع، والتطبيقات الواقعية.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

تمثل أجهزة الكشف المستندة إلى المرساة نهجًا مهمًا وأساسيًا في الرؤية الحاسوبية (CV) لمعالجة مهمة الكشف عن الأجسام. تعمل هذه النماذج باستخدام مجموعة محددة مسبقًا من المربعات المرجعية، والتي يُشار إليها عادةً باسم "المراسي" أو "المسبقين"، والتي لها أحجام ونسب أبعاد محددة. يتم توزيع نقاط الارتكاز عبر الصورة وتعمل كتخمينات أو قوالب أولية، مما يمكّن النموذج من التنبؤ بشكل أكثر فعالية بموقع وفئة الأجسام، خاصة عند التعامل مع عناصر ذات مقاييس وأشكال مختلفة. العديد من نماذج اكتشاف الأجسام المبكرة المؤثرة، مثل بعض إصدارات Ultralytics YOLO باستخدام هذه التقنية.

كيفية عمل أجهزة الكشف القائمة على المرساة

يتمثّل المفهوم الأساسي وراء أجهزة الكشف القائمة على المرساة في تراكب شبكة كثيفة من مربعات الارتساء المحددة مسبقًا عبر صورة الإدخال في مواقع ومقاييس متعددة. يتوافق كل مربع تثبيت مع جسم محتمل بحجم وشكل محددين. أثناء عملية تدريب النموذج، يتعلم الكاشف أمرين أساسيين لكل مرساة: أولاً، يصنف ما إذا كان صندوق المرساة يحتوي على جسم أو خلفية ذات صلة؛ ثانياً، يقوم بتحسين موضع المرساة وأبعادها (عملية تسمى الانحدار) لتتناسب بدقة مع الصندوق المحيط بالجسم الفعلي.

ضع في اعتبارك اكتشاف المركبات المختلفة في صورة لشارع مزدحم. بدلاً من تحليل كل مجموعة بكسل، يستخدم النموذج المستند إلى نقطة الارتكاز قوالب مربعات محددة مسبقاً: مربعات صغيرة للمشاة، ومربعات متوسطة الحجم للسيارات، ومستطيلات أكبر للحافلات. يتم وضع هذه القوالب (المراسي) عبر الصورة. إذا تداخلت إحدى المراسي بشكل كبير مع سيارة، يتعلم النموذج تصنيفها على أنها "سيارة" ويضبط إحداثيات المرساة وحجمها لتناسب السيارة بشكل مثالي. يتم تصنيف المراسي التي تغطي الطريق أو المباني فقط على أنها "خلفية". يساعد هذا النهج المنهجي، الذي يسترشد بأشكال محددة مسبقًا، في إدارة تعقيد عملية اكتشاف الأجسام. عادةً ما يتم تقييم الأداء باستخدام مقاييس مثل التقاطع على الاتحاد (IoU) ومتوسط متوسط الدقة (mAP).

الميزات والمزايا الرئيسية

تقدم أجهزة الكشف المستندة إلى المرساة، والتي غالبًا ما تستفيد من الشبكات العصبية التلافيفية القوية (CNNs) كعمودها الفقري، مزايا متميزة:

  • التعامل مع تباين المقياس ونسبة العرض إلى الارتفاع: تغطي نقاط الارتكاز المحددة مسبقًا بشكل صريح مختلف الأشكال والأحجام، مما يجعل هذه النماذج جيدة بطبيعتها في اكتشاف الأجسام بغض النظر عن أبعادها أو اتجاهها.
  • التنبؤ المنظم: توفر المراسي طريقة منظمة لتوليد مقترحات الكائنات عبر الصورة بأكملها، مما يضمن تغطية شاملة.
  • استرجاع عالٍ: من خلال توليد عدد كبير من مواقع الكائنات المحتملة عبر نقاط الارتكاز، غالبًا ما تحقق هذه الطرق استرجاعًا عاليًا، مما يعني أنها جيدة في العثور على معظم الكائنات ذات الصلة، على الرغم من أن هذا يتطلب أحيانًا خطوات ما بعد المعالجة مثل القمع غير الأقصى (NMS) لتصفية التكرارات.
  • أداء مثبت: أظهرت البنى مثل Faster R-CNN و SSD (كاشف متعدد الصناديق أحادي اللقطة) أداءً قويًا على مجموعات البيانات القياسية مثل COCO.

التطبيقات الواقعية

تم نشر أجهزة الكشف القائمة على المرساة بنجاح في العديد من سيناريوهات العالم الحقيقي:

  1. المركبات ذاتية القيادة: يُعدّ اكتشاف المركبات والمشاة وراكبي الدراجات الهوائية وعلامات المرور من مختلف الأحجام والمسافات أمراً بالغ الأهمية للملاحة الآمنة. تساعد الطرق المستندة إلى المرساة في ضمان تحديد الأجسام القريبة والبعيدة، الكبيرة والصغيرة، بشكل موثوق. تعتمد شركات مثل Waymo اعتماداً كبيراً على الاكتشاف القوي للأجسام. اكتشف المزيد حول الذكاء الاصطناعي في السيارات ذاتية القيادة.
  2. تحليلات البيع بالتجزئة: في المتاجر، يمكن لهذه الكواشف مراقبة الأرفف لتحديد المنتجات أو التحقق من مستويات المخزون أو تحليل أنماط حركة العملاء من خلال اكتشاف الأشخاص. تُعد القدرة على التعامل مع أحجام وأشكال عبوات المنتجات المختلفة ضرورية لتطبيقات مثل إدارة المخزون القائمة على الذكاء الاصطناعي.

أجهزة الكشف المستندة إلى مرساة مقابل أجهزة الكشف الخالية من المرساة

في السنوات الأخيرة، برزت أجهزة الكشف الخالية من المراسي كبديل شائع. على عكس النماذج القائمة على المرساة (على سبيل المثال, Ultralytics YOLOv5)، تتنبأ النُهج الخالية من المرتكزات بمواقع الأجسام وأحجامها مباشرةً، وغالبًا ما يتم ذلك عن طريق تحديد النقاط الرئيسية (مثل مراكز الأجسام أو زواياها) أو التنبؤ بالمسافات من نقطة إلى حدود الجسم، مما يلغي الحاجة إلى أشكال مرتكزات محددة مسبقًا.

تشمل الاختلافات الرئيسية ما يلي:

  • التعقيد: تتطلب النماذج القائمة على المرساة تصميمًا دقيقًا وضبطًا دقيقًا لمعلمات المرساة (الأحجام والنسب والمقاييس)، والتي يمكن أن تعتمد على مجموعة البيانات. تعمل النماذج الخالية من المرساة على تبسيط تصميم رأس الكشف.
  • المرونة: قد تتكيف الطرق الخالية من المرساة بشكل أفضل مع الأجسام ذات نسب أبعاد غير عادية أو أشكال غير ممثلة بشكل جيد من خلال مجموعة المرساة الثابتة.
  • الكفاءة: يمكن أن يؤدي التخلص من نقاط الارتكاز إلى تقليل عدد التنبؤات التي يحتاج النموذج إلى إجرائها، مما قد يؤدي إلى استنتاج أسرع ومعالجة لاحقة أبسط.

في حين أن أجهزة الكشف القائمة على الارتكاز مثل YOLOv4 كانت ناجحة للغاية، فإن العديد من البنى الحديثة، بما في ذلك Ultralytics YOLO11، قد اعتمدت تصميمات خالية من المراسي للاستفادة من مزاياها في البساطة والكفاءة. يمكنك استكشاف مزايا الكشف الخالي من المراسي في YOLO11 والاطلاع على المقارنات بين نماذج YOLO المختلفة.

الأدوات والتدريب

يتضمن تطوير نماذج اكتشاف الكائنات ونشرها، سواء كانت قائمة على المرساة أو خالية من المرساة، استخدام أطر عمل مثل PyTorch أو TensorFlow ومكتبات مثل OpenCV. وتوفر منصات مثل Ultralytics HUB تدفقات عمل مبسطة لتدريب النماذج المخصصة وإدارة مجموعات البيانات ونشر الحلول، ودعم مختلف بنيات النماذج. ولمزيد من التعلّم، تسرد موارد مثل Papers With Code أحدث النماذج، وتغطي الدورات التدريبية من منصات مثل DeepLearning.AI المفاهيم الأساسية.

قراءة الكل