تعرّف على ماهية التقاطع على الاتحاد (IoU)، وكيفية حسابه، ودوره الحاسم في اكتشاف الأجسام وتقييم نموذج الذكاء الاصطناعي.
يُعد التقاطع على الاتحاد (IoU) مقياسًا أساسيًا يُستخدم على نطاق واسع في الرؤية الحاسوبية، خاصةً في مهام مثل اكتشاف الأجسام وتجزئة الصور. يقيس هذا المقياس مدى دقة الحدود المتوقعة (مثل المربع المحيط في اكتشاف الأجسام) التي تتطابق مع الحدود الفعلية الحقيقية للجسم. بشكل أساسي، يقيس IoU درجة التداخل بين المنطقة المتوقعة والمنطقة الحقيقية، مما يوفر درجة بسيطة وفعالة لأداء التوطين. يُعتبر فهم IoU ضروريًا لتقييم فعالية نماذج الرؤية الحاسوبية ومقارنتها، خاصةً بالنسبة للمستخدمين المطلعين على مفاهيم التعلم الآلي الأساسية.
تُعدّ وحدة المعالجة المتكاملة للأشعة بمثابة مؤشر أداء حاسم عند تقييم مدى جودة النماذج، مثل Ultralytics YOLOفي تحديد موقع الأجسام داخل الصورة. بينما يخبرنا التصنيف ما هو الكائن الموجود (انظر تصنيف الصور)، تخبرنا وحدة تحديد الموقع المكاني بمدى دقة النموذج في تحديد موقعه. تُعد هذه الدقة المكانية أمرًا حيويًا في العديد من سيناريوهات العالم الحقيقي حيث يكون التوطين الدقيق مهمًا مثل التصنيف الصحيح. تشير درجات IoU المرتفعة إلى أن تنبؤات النموذج تتوافق بشكل وثيق مع حدود الكائن الفعلية. تعتمد العديد من المعايير القياسية للكشف عن الأجسام، مثل تقييم مجموعة بيانات COCO الشهيرة وتحدي PASCAL VOC الأقدم، اعتمادًا كبيرًا على عتبات IoU لتحديد ما إذا كان الاكتشاف يعتبر صحيحًا. يمكنك استكشاف مجموعات البيانات المعيارية المختلفة مثل COCO و PASCAL VOC في وثائقنا.
تتضمّن العملية الحسابية قسمة المساحة التي يتداخل فيها المربع المحدّد المتوقّع مع المربع المحدّد الحقيقي (التقاطع) على المساحة الإجمالية التي يغطيها كلا المربعين معًا (الاتحاد). ينتج عن هذه النسبة درجة تتراوح بين 0 و1. تشير الدرجة 1 إلى تطابق تام، ما يعني أن المربع المتوقع يتداخل تمامًا مع الحقيقة الأرضية. تشير الدرجة 0 إلى عدم وجود تداخل على الإطلاق. تتمثل إحدى الممارسات الشائعة في العديد من بروتوكولات تقييم اكتشاف الأجسام في اعتبار التنبؤ صحيحًا إذا كانت درجة وحدة التداخل في المربع الأرضي تفي بعتبة معينة أو تتجاوزها، وغالبًا ما تكون 0.5. ومع ذلك، قد يتم استخدام عتبات أكثر صرامة (على سبيل المثال، 0.75 أو حتى 0.9) اعتمادًا على حاجة التطبيق إلى الدقة، كما هو موضح في مقاييس مثل mAP@.5:.95 المستخدمة في تقييمات COCO. تؤثر هذه العتبة بشكل مباشر على مقاييس مثل الدقة والاستدعاء.
إن قدرة IoU على قياس دقة التوطين تجعله لا غنى عنه في مختلف المجالات:
بينما يقيس IoU على وجه التحديد جودة التوطين لتنبؤ واحد مقابل حقيقة أرضية، إلا أنه غالبًا ما يُستخدم إلى جانب مقاييس أخرى للحصول على صورة أداء كاملة.
لا تُعد وحدة الكشف عن الأجسام مجرد مقياس للتقييم؛ فهي أيضًا جزء لا يتجزأ من عملية التدريب نفسها. العديد من البنى الحديثة للكشف عن الأجسام، بما في ذلك المتغيرات من Ultralytics YOLOv8وYOLOv10، تستخدم IoU أو أشكاله المختلفة (مثل IoU المعمم (GIoU) أو IoU-IoU للمسافة (DIoU) أو IoU-IoU الكامل (CIoU) مباشرةً ضمن وظائف الخسارة الخاصة بها. تساعد هذه الخسائر المتقدمة المستندة إلى IoU النموذج على تعلم التنبؤ بالمربعات المحدودة التي لا تتداخل بشكل جيد فحسب، بل تأخذ في الاعتبار أيضًا عوامل مثل المسافة بين المراكز واتساق نسبة الأبعاد، مما يؤدي إلى تقارب أسرع وأداء توطين أفضل مقارنةً بخسائر الانحدار التقليدية. يمكنك العثور على مقارنات مفصلة بين نماذج YOLO المختلفة في وثائقنا.
تساعد مراقبة IoU أثناء تدريب النموذج وضبط المعلمة الفائقة المطورين على تحسين النماذج من أجل توطين أفضل. تسمح أدوات مثل Ultralytics HUB بتتبع IoU وغيرها من المقاييس الأخرى، مما يسهل دورة تحسين النموذج. على الرغم من فائدتها الواسعة الانتشار، قد تكون وحدة قياس IoU القياسية غير حساسة في بعض الأحيان، خاصةً بالنسبة للمربعات غير المتداخلة أو المربعات ذات المقاييس المختلفة جداً. وقد حفز هذا الأمر على تطوير متغيرات IoU المذكورة أعلاه. وعلى الرغم من ذلك، لا تزال وحدة قياس الأداء المعيارية حجر الزاوية في تقييم الرؤية الحاسوبية ومفهومًا أساسيًا في التعلم العميق (DL).