المربع المحدّد هو إطار مستطيل يُستخدم في الرؤية الحاسوبية للإشارة إلى الموقع والمدى التقريبي لجسم ما داخل صورة أو إطار فيديو. تُحدَّد هذه المربعات عادةً بإحداثيات الزاويتين العلوية اليسرى والسفلية اليمنى (أو نقطة المركز والعرض والارتفاع)، وتوفر هذه المربعات طريقة بسيطة وفعالة في الوقت ذاته لتحديد موقع الجسم ومقدار المساحة التي يشغلها. تُعد المربعات المحدودة مكونات أساسية في العديد من مهام السيرة الذاتية، بما في ذلك اكتشاف الأجسام وتتبع الأجسام والتعليق التوضيحي للصور، وتشكل حجر الزاوية للعديد من أنظمة الذكاء الاصطناعي الحديثة وأنظمة التعلم الآلي. إنها ضرورية لتمكين الآلات من فهم ليس فقط ما هي الأشياء الموجودة، ولكن أيضًا مكان وجودها في المشهد المرئي.
الأهمية في اكتشاف الكائنات
تعتبر المربعات المحدودة ضرورية لتدريب نماذج اكتشاف الأجسام وتقييمها. في المهام التي تعالجها نماذج مثل Ultralytics YOLOتعمل المربعات المحدودة بمثابة "الحقيقة الأساسية" أثناء عملية التدريب. وهذا يعني أنها تمثل الموقع والحجم الصحيحين للأجسام في بيانات التدريب، مما يعلم النموذج تحديد موقع الأجسام بدقة. تبدأ هذه العملية غالبًا بتعليقات توضيحية دقيقة للبيانات، حيث يقوم البشر أو الأدوات الآلية برسم هذه المربعات حول الأجسام في الصور، وغالبًا ما تستخدم منصات مثل CVAT أو تتكامل مع منصات مثل Ultralytics HUB لإدارة مجموعة البيانات. أثناء الاستدلال، يتنبأ النموذج المُدرَّب بالمربعات المُحددة حول الكائنات المكتشفة، إلى جانب تصنيفات الفئات ودرجات الثقة. تُعد هذه القدرة على التوطين أمرًا حيويًا للتطبيقات التي لا تتطلب تحديد الكائنات فحسب، بل أيضًا تحديد موقعها بدقة.
المفاهيم الأساسية المتعلقة بالمربعات المحدودة
ترتبط العديد من المقاييس والتقنيات ارتباطًا وثيقًا باستخدام وتقييم المربعات المحدودة في نماذج التعلم الآلي:
- التقاطع على الاتحاد (IoU): مقياس يُستخدم لقياس التداخل بين المربع المحدد المتوقع والمربع المحدد الحقيقي الأرضي. وهو يقيس دقة التوطين.
- الكبت غير الأقصى (NMS): تقنية ما بعد المعالجة تُستخدم لإزالة المربعات المحدودة الزائدة والمتداخلة لنفس الكائن، مع الاحتفاظ فقط بالتنبؤ الأكثر ثقة.
- متوسط الدقة المتوسطة (mAP): مقياس قياسي لتقييم أداء نماذج اكتشاف الأجسام، مع الأخذ في الاعتبار كلاً من دقة التصنيف ودقة تحديد الموقع (غالبًا ما يعتمد على عتبة وحدة تحديد الموقع). انظر مقاييس أداءYOLO المفصلة.
- صناديق التثبيت: مربعات محددة مسبقًا بأحجام مختلفة ونسب أبعاد مختلفة تُستخدم في بعض أجهزة الكشف (مثل إصدارات YOLO القديمة) للمساعدة في التنبؤ بالمربعات المحدودة بشكل أكثر فعالية. النماذج الأحدث، بما في ذلك YOLO11، غالبًا ما تكون خالية من المرساة، مما يبسط رأس الكشف.
- مجموعة بيانات COCO: مجموعة بيانات واسعة النطاق لاكتشاف الكائنات وتجزئتها والتعليق عليها تُستخدم على نطاق واسع لقياس نماذج اكتشاف الكائنات. يوفر Ultralytics وصولاً سهلاً إلى مجموعة بيانات COCO ومجموعات بيانات الكشف الأخرى.
مربعات الحدود مقابل المصطلحات ذات الصلة
بينما تحدد المربعات المحدودة القياسية (المحاذاة للمحور) موقع الأجسام باستخدام مستطيلات بسيطة، تقدم تقنيات الرؤية الحاسوبية الأخرى مستويات مختلفة من التفاصيل أو تتعامل مع سيناريوهات مختلفة:
التطبيقات في سيناريوهات العالم الحقيقي
تعد الصناديق المحدودة جزءًا لا يتجزأ من العديد من تطبيقات الذكاء الاصطناعي العملية:
- المركبات ذاتية القيادة: تعتمد السيارات ذاتية القيادة اعتماداً كبيراً على اكتشاف الأجسام لتحديد وتحديد مواقع المشاة والمركبات الأخرى وإشارات المرور والعوائق باستخدام المربعات المحدودة. هذا الوعي المكاني، الذي يتحقق غالباً من خلال نماذج التعلُّم العميق، أمر بالغ الأهمية للملاحة الآمنة واتخاذ القرارات. تعرض شركات مثل Waymo هذه التقنية على نطاق واسع. تقدم Ultralytics رؤى حول الذكاء الاصطناعي في السيارات ذاتية القيادة.
- تحليلات البيع بالتجزئة: في مجال البيع بالتجزئة، تساعد الصناديق المربوطة في إدارة المخزون القائمة على الذكاء الاصطناعي من خلال الكشف عن المنتجات على الرفوف، ومراقبة مستويات المخزون، وتحليل سلوك العملاء من خلال التفاعل على الرفوف أو أنماط حركة المرور على الأقدام(عدّ الأشياء).
- الأمن والمراقبة: تُمكِّن الصناديق المحدودة أنظمة المراقبة الآلية من اكتشاف وتتبع الأفراد أو الأشياء ذات الأهمية في الوقت الفعلي، مما يؤدي إلى إطلاق تنبيهات عند الوصول غير المصرح به أو الأنشطة المشبوهة. وهذا أمر أساسي لبناء تطبيقات مثل أنظمة الإنذار الأمني.
- تحليل الصور الطبية: في مجال الرعاية الصحية، تساعد المربعات المحدودة أطباء الأشعة والأطباء السريريين من خلال تسليط الضوء على الحالات الشاذة المحتملة مثل الأورام أو الآفات في عمليات المسح (الأشعة السينية، والتصوير المقطعي المحوسب، والتصوير بالرنين المغناطيسي)، مما يساعد في تشخيص أسرع وأكثر دقة. انظر الأمثلة في قسم الأشعة: نظرة عامة على الذكاء الاصطناعي Ultralytics لتحليل الصور الطبية.
- الزراعة: تُستخدم الصناديق المحدودة في الزراعة الدقيقة لمهام مثل تحديد الثمار للحصاد(الكشف عن الفاكهة)، أو مراقبة صحة المحاصيل، أو الكشف عن الآفات.