مسرد المصطلحات

أجهزة الكشف القائمة على المرساة

اكتشف كيف تُحدِث أجهزة الكشف القائمة على المرساة ثورة في اكتشاف الأجسام من خلال تحديد الموقع الدقيق، والقدرة على التكيف على نطاق واسع، والتطبيقات الواقعية.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

تمثل أجهزة الكشف المستندة إلى المرساة نهجًا أساسيًا في الرؤية الحاسوبية (CV) لإجراء الكشف عن الأجسام. وتعتمد هذه النماذج على مجموعة من المربعات المرجعية المحددة مسبقًا، والمعروفة باسم "المراسي" أو "المسبقين"، والتي لها أحجام ونسب أبعاد محددة. تعمل نقاط الارتكاز هذه كنقاط بداية أو قوالب عبر الصورة، مما يساعد النموذج على التنبؤ بموقع وفئة الأجسام المحتملة بشكل أكثر فعالية، خاصة تلك التي تختلف بشكل كبير في الحجم والشكل. استخدمت العديد من البنى الناجحة السابقة للكشف عن الأجسام هذه الطريقة.

كيفية عمل أجهزة الكشف القائمة على المرساة

تتضمن الفكرة الأساسية وراء أجهزة الكشف المستندة إلى المرساة وضع شبكة كثيفة من مربعات الارتساء عبر صورة الإدخال في مواقع مختلفة. يمثّل كل مربع مرساة كائنًا محتملًا مرشحًا بمقياس محدد مسبقًا ونسبة عرض إلى ارتفاع. أثناء عملية التدريب، يتعلم النموذج أمرين رئيسيين لكل مرساة: أولاً، ما إذا كانت المرساة تحتوي على كائن ذي صلة (التصنيف)، وثانياً، كيفية ضبط موضع المرساة وأبعادها (الانحدار) لتتناسب بإحكام مع المربع المحيط بالكائن الفعلي.

تخيل البحث عن مركبات مختلفة في صورة موقف سيارات كبير. بدلاً من المسح الضوئي بكسل تلو الآخر، يمكنك استخدام قوالب مستطيلة محددة مسبقاً (نقاط ارتكاز): قوالب رأسية صغيرة للدراجات النارية، وقوالب متوسطة مربعة الشكل للسيارات، وقوالب كبيرة عريضة للحافلات. يمكنك تراكب هذه القوالب عبر الصورة. عندما يتداخل القالب بشكل كبير مع سيارة، يتعلم النموذج تأكيد "نعم، هذه سيارة" ويغير القالب قليلاً ويغير حجمه ليتطابق مع حدود السيارة بشكل مثالي. يتم تصنيف القوالب التي تغطي في الغالب الخلفية على هذا النحو. تغطي هذه الطريقة الاحتمالات بشكل منهجي، مسترشدة بالأشكال المحددة مسبقاً. يُقاس الأداء غالبًا باستخدام مقاييس مثل التقاطع على الاتحاد (IoU) ومتوسط متوسط الدقة (mAP).

الميزات والمزايا الرئيسية

تقدم أجهزة الكشف القائمة على المرساة، والتي غالبًا ما تكون مبنية على الشبكات العصبية التلافيفية (CNNs)، العديد من الخصائص البارزة:

  • التعامل مع تباين المقياس ونسبة العرض إلى الارتفاع: تغطي نقاط الارتكاز المحددة مسبقًا أحجام وأشكال الأجسام المختلفة بشكل صريح، مما يحسن من قوة الاكتشاف.
  • توليد مقترحات منظمة: توفر المراسي طريقة منظمة لتوليد مقترحات الكائنات عبر الصورة، مما يبسط المراحل الأولية للكشف مقارنةً ببعض الطرق السابقة.
  • أداء مثبت: أظهرت البنى مثل Faster R-CNN و SSD (كاشف الصندوق المتعدد اللقطة الواحدة) أداءً قويًا على مجموعات بيانات معيارية مختلفة.

أجهزة الكشف المستندة إلى مرساة مقابل أجهزة الكشف الخالية من المرساة

يتمثل أحد التطورات المهمة في مجال اكتشاف الأجسام في ظهور أجهزة الكشف الخالية من المرتكزات. على عكس النماذج القائمة على المرساة (على سبيل المثال، YOLOv4)، تتنبأ الطرق الخالية من المرساة بمواقع الأجسام وأحجامها مباشرة، وغالبًا ما يتم ذلك عن طريق تحديد النقاط الرئيسية (مثل الزوايا أو المراكز) أو التنبؤ بالمسافات من نقطة إلى حدود الجسم، دون الاعتماد على أشكال مرساة محددة مسبقًا.

تشمل الفروق الرئيسية ما يلي:

  • التعقيد: تتطلب الطرق المستندة إلى المرساة تصميمًا دقيقًا وضبطًا دقيقًا لمعلمات المرساة (المقاييس والنسب والكثافة)، والتي يمكن أن تكون معقدة وتعتمد على مجموعة البيانات. تستبعد الأساليب الخالية من المرساة خطوة الضبط هذه.
  • المرونة: قد تتكيف أجهزة الكشف الخالية من المرساة بشكل أفضل مع الأجسام ذات نسب أبعاد غير عادية أو أحجام غير ممثلة بشكل جيد من خلال مجموعة المرساة الثابتة.
  • الكفاءة: يمكن أن تؤدي إزالة خطوات توليد المرساة والمطابقة في بعض الأحيان إلى نماذج أبسط وأسرع.

النماذج الحديثة مثل Ultralytics YOLO11 تستخدم أساليب خالية من الارتكاز، وتستفيد من مزاياها في الكفاءة والبساطة. يمكنك قراءة المزيد حول مزايا الاكتشاف الخالي من المراسي في YOLO11.

التطبيقات الواقعية

على الرغم من الاتجاه نحو الأساليب الخالية من المرساة، فقد تم نشر أجهزة الكشف القائمة على المرساة بنجاح في العديد من التطبيقات:

  1. القيادة الذاتية: يُعد اكتشاف المركبات والمشاة وراكبي الدراجات وراكبي الدراجات وإشارات المرور أمراً بالغ الأهمية للسيارات ذاتية القيادة. وقد استُخدمت النماذج المستندة إلى المرساة على نطاق واسع لتحديد هذه الأجسام بشكل موثوق عبر مسافات ومنظورات مختلفة. اقرأ المزيد عن الذكاء الاصطناعي في السيارات ذاتية القيادة وأبحاث القيادة الذاتية ذات الصلة.
  2. تحليلات البيع بالتجزئة: غالبًا ما تتضمن مراقبة الرفوف لمعرفة مستويات المخزون، أو اكتشاف العناصر الموضوعة في غير مكانها، أو تحليل أنماط حركة العملاء، تحديد العديد من الأشياء الصغيرة (المنتجات). يمكن تهيئة الأنظمة القائمة على المرساة للتعامل مع المقاييس المحددة ونسب العرض إلى الارتفاع الموجودة في بيئات البيع بالتجزئة. استكشف كيف يدعم الذكاء الاصطناعي إدارة مخزون التجزئة الأكثر ذكاءً واتجاهات تحليلات التجزئة العامة.

في الوقت الذي تكتسب فيه الأساليب الخالية من المرتكزات شعبية، فإن فهم أجهزة الكشف القائمة على المرتكزات أمر ضروري لتقدير تطور اكتشاف الأجسام واستمرار أهميتها في سياقات محددة أو أنظمة قديمة. أدوات مثل PyTorch و TensorFlow تدعم كلاً من تطوير النماذج القائمة على المرساة والنماذج الخالية من المرساة، بينما تعمل منصات مثل Ultralytics HUB على تبسيط تدريب ونشر أجهزة الكشف الحديثة.

قراءة الكل