مسرد المصطلحات

الصندوق المحيط

تعرف على كيفية تمكين الصناديق المحدودة من اكتشاف الأجسام، والذكاء الاصطناعي، وأنظمة التعلم الآلي. استكشف دورها في تطبيقات الرؤية الحاسوبية!

المربع المحدّد هو عبارة عن تعليق توضيحي مستطيل يُستخدم في الرؤية الحاسوبية للإشارة إلى موقع الجسم داخل صورة أو إطار فيديو. وهو بمثابة مكون أساسي لاكتشاف الأجسام، حيث يوفر طريقة بسيطة وفعالة في نفس الوقت لتحديد موقع الجسم وحجمه. في التعلّم الآلي، يتم تدريب النماذج على مجموعات بيانات كبيرة من الصور ذات المربعات المحدّدة لتعلّم كيفية تحديد الأجسام وتعيين مواقعها بنفسها. تتضمن مخرجات هذه النماذج إحداثيات الصندوق، وتسمية الفئة (على سبيل المثال، "سيارة" أو "شخص")، ودرجة ثقة تشير إلى مدى يقين النموذج في تنبؤاته.

كيفية عمل الصناديق المحدودة

يُعرَّف الصندوق المحدود عادةً بمجموعة من الإحداثيات التي تحدد موضعه وحجمه. أكثر التمثيلات شيوعًا هي:

  • إحداثيات أعلى اليسار مع العرض والارتفاع (س، ص، ث، ح): يحدد هذا التنسيق إحداثيات x و y للزاوية العلوية اليسرى، بالإضافة إلى عرض المربع وارتفاعه.
  • نقاط الزاوية (x_min، y_min، x_max، y_max): يحدد هذا التنسيق إحداثيات الزاويتين العلوية اليسرى والسفلية اليمنى للمستطيل.

تُستخدم هذه الإحداثيات لتدريب نماذج التعلّم العميق، والتي تتعلم التنبؤ بهذه القيم للصور الجديدة غير المرئية. وغالبًا ما يتم تقييم دقة المربع المحدد المتوقع باستخدام مقياس يسمى التقاطع على الاتحاد (IoU)، والذي يقيس التداخل بين المربع المتوقع والمربع الحقيقي الأرضي. تم تحسين نماذج اكتشاف الأجسام الحديثة، مثل Ultralytics YOLO11، بشكل كبير لتوليد مربعات محددة دقيقة في الوقت الفعلي.

أنواع الصناديق المحدودة

هناك نوعان أساسيان من المربعات المحدودة:

  1. الصندوق المحيط المحاذي للمحور: هذا هو النوع الأكثر شيوعًا، حيث تتم محاذاة جوانب المستطيل مع المحاور الأفقية والرأسية للصورة. من السهل تمثيلها ومعالجتها ولكن يمكن أن تكون غير فعالة للأجسام التي يتم تدويرها أو غير منتظمة الشكل، حيث قد يتضمن المربع مساحة خلفية كبيرة.
  2. الصندوق المحيط الموجه (OBB): يشتمل هذا النوع من الصناديق على معلمة إضافية للدوران، مما يسمح له بالتناسب بشكل أكثر ملاءمة حول الأجسام المائلة. تُفيد OBBs بشكل خاص في التطبيقات المتخصصة مثل تحليل صور الأقمار الصناعية أو الصور الجوية من الطائرات بدون طيار، حيث يتم عرض الأجسام غالبًا من زوايا مختلفة. تدعم نماذج مثل YOLO11 اكتشاف الأجسام الموجهة للتعامل مع هذه السيناريوهات بشكل أكثر فعالية.

العلاقة بالمفاهيم الأخرى

ترتبط المربعات المحدودة ارتباطًا وثيقًا بمهام الرؤية الحاسوبية الأخرى ولكنها تخدم غرضًا مميزًا.

  • اكتشاف الكائنات مقابل تجزئة الصور: بينما يستخدم الكشف عن الكائنات المربعات المحدودة لتحديد موقع الكائنات، فإن تجزئة الصورة تقدم فهمًا أكثر تفصيلاً لشكل الكائن. على سبيل المثال، يذهب تجزئة المثيل إلى أبعد من ذلك من خلال تحديد الحدود الدقيقة على مستوى البكسل لكل كائن مميز، بدلاً من مجرد رسم مستطيل حوله. هذا مفيد للتطبيقات التي تتطلب معلومات دقيقة عن الشكل. يمكن العثور على مزيد من المعلومات في هذا الدليل لتجزئة المثيل.
  • الصندوق المحيط مقابل صندوق الارتكاز: في بعض نماذج الكشف عن الأجسام، والمعروفة باسم الكاشفات القائمة على المرتكزات، تُستخدم مربعات محددة مسبقًا تُسمى "مربعات الارتكاز" كمراجع لمساعدة النموذج على التنبؤ بالمربع المحدد النهائي. على النقيض من ذلك، تتنبأ أجهزة الكشف الخالية من المرتكزات بالمربعات المحدّدة مباشرةً دون هذه الإعدادات المسبقة، مما يبسّط بنية النموذج في كثير من الأحيان.

التطبيقات في سيناريوهات العالم الحقيقي

تعد الصناديق المحدودة جزءًا لا يتجزأ من العديد من تطبيقات الذكاء الاصطناعي العملية:

  1. المركبات ذاتية القيادة: تعتمد السيارات ذاتية القيادة اعتماداً كبيراً على اكتشاف الأجسام لتحديد المشاة والمركبات الأخرى وإشارات المرور وتحديد مواقعها باستخدام المربعات المحدودة. يُعد هذا الوعي المكاني، الذي يتحقق غالباً من خلال نماذج التعلم العميق، أمراً بالغ الأهمية للملاحة الآمنة. تعرض شركات مثل Waymo هذه التقنية على نطاق واسع. تقدم Ultralytics رؤى حول الذكاء الاصطناعي في السيارات ذاتية القيادة.
  2. تحليلات البيع بالتجزئة: في مجال البيع بالتجزئة، تساعد الصناديق المربوطة في إدارة المخزون القائمة على الذكاء الاصطناعي من خلال اكتشاف المنتجات على الرفوف، ومراقبة مستويات المخزون، وتحليل سلوك العملاء من خلال أنماط حركة المرور على الأقدام(عدّ الأشياء).
  3. الأمن والمراقبة: تمكّن الصناديق المحدودة أنظمة المراقبة الآلية من اكتشاف وتتبع الأفراد أو الأشياء في الوقت الفعلي، وإطلاق تنبيهات للأنشطة المشبوهة. وهذا أمر أساسي لبناء تطبيقات مثل أنظمة الإنذار الأمني.
  4. تحليل الصور الطبية: في مجال الرعاية الصحية، تساعد المربعات المحدودة الأطباء السريريين من خلال تسليط الضوء على الحالات الشاذة المحتملة مثل الأورام في الأشعة، مما يساعد في سرعة التشخيص. يمكنك الاطلاع على أمثلة على ذلك في قسم الأشعة: أبحاث الذكاء الاصطناعي وعلى صفحة تحليل الصور الطبية.
  5. الزراعة: تُستخدم الصناديق المحدودة في الزراعة الدقيقة لمهام مثل تحديد الثمار للحصاد أو مراقبة صحة المحاصيل أو الكشف عن الآفات، كما هو مفصل في مدونتنا عن الرؤية الحاسوبية في الزراعة.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون ونمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة