مسرد المصطلحات

متوسط الدقة المتوسطة (mAP)

اكتشف أهمية متوسط الدقة المتوسطة (mAP) في تقييم نماذج اكتشاف الأجسام لتطبيقات الذكاء الاصطناعي مثل القيادة الذاتية والرعاية الصحية.

متوسط الدقة المتوسطة (mAP) هو مقياس تقييم حاسم يُستخدم على نطاق واسع في مجال الرؤية الحاسوبية، خاصةً في مهام اكتشاف الأجسام. وهو يوفر درجة واحدة وشاملة تلخص أداء النموذج من خلال قياس دقة تنبؤاته عبر جميع فئات الكائنات. تأخذ درجة mAP في الحسبان كلاً من صحة التصنيف (هل الكائن هو ما يقوله النموذج؟) وجودة التوطين (ما مدى تطابق المربع المحيط المتوقع مع موقع الكائن الفعلي؟). نظرًا لأنه يقدم تقييمًا متوازنًا، فقد أصبح مقياس mAP المقياس القياسي لمقارنة أداء نماذج اكتشاف الأجسام المختلفة مثل Ultralytics YOLO.

كيف تعمل mAP

لفهم mAP، من المفيد أولاً فهم مكوناته الأساسية: الدقة والتذكر والتقاطع على الاتحاد (IoU).

  • الدقة: يقيس مدى دقة تنبؤات النموذج. يجيب على السؤال: "من بين جميع الأجسام التي اكتشفها النموذج، ما هو الكسر الذي كان صحيحاً؟
  • الاسترجاع: يقيس مدى نجاح النموذج في العثور على جميع الكائنات الفعلية. يجيب على السؤال: "من بين جميع الأجسام الحقيقية الموجودة في الصورة، ما هو الجزء الذي نجح النموذج في اكتشافه بنجاح؟
  • التقاطع على الاتحاد (IoU): مقياس يقيس مدى تداخل المربع المحدود المتوقع مع المربع المحدود الحقيقي (المسمى يدويًا). عادةً ما يُعتبر الاكتشاف إيجابيًا حقيقيًا إذا كان التقاطع على الاتحاد (IoU) أعلى من عتبة معينة (على سبيل المثال، 0.5).

يقوم حساب mAP بتجميع هذه المفاهيم. بالنسبة لكل فئة من فئات الكائنات، يتم إنشاء منحنى الدقة-الاستدعاء عن طريق رسم الدقة مقابل الاستدعاء عند عتبات درجات الثقة المختلفة. إن متوسط الدقة (AP) لتلك الفئة هو المساحة تحت هذا المنحنى، مما يوفر رقمًا واحدًا يمثل أداء النموذج على تلك الفئة المحددة. أخيرًا، يتم حساب متوسط الدقة المتوسطة بأخذ متوسط درجات الدقة المتوسطة عبر جميع فئات الكائنات. تخطو بعض مخططات التقييم، مثل مخطط مجموعة بيانات COCO الشهيرة، خطوة إلى الأمام من خلال حساب متوسط متوسط نقاط تقييم متوسط الأداء عبر عتبات IoU المتعددة لتوفير تقييم أكثر قوة.

التمييز بين mAP والمقاييس الأخرى

على الرغم من ارتباطها بمقاييس التقييم الأخرى، إلا أن لخطة تقييم الأداء الإداري غرضاً متميزاً.

  • الدقة: تقيس الدقة نسبة التنبؤات الصحيحة إلى إجمالي عدد التنبؤات. تُستخدم بشكل عام لمهام التصنيف وهي غير مناسبة بشكل عام لاكتشاف الأجسام، حيث يجب أن يكون التنبؤ مصنفًا ومحددًا بشكل صحيح.
  • درجة F1: درجة F1 هي المتوسط التوافقي للدقة والاستعادة. على الرغم من أنه مفيد، إلا أنه يتم حسابه عادةً عند عتبة ثقة واحدة. في المقابل، توفر mAP تقييمًا أكثر شمولاً من خلال حساب متوسط الأداء عبر جميع العتبات.
  • الثقة: هذه ليست مقياس تقييم للنموذج ككل، بل هي درجة يتم تعيينها لكل تنبؤ فردي، تشير إلى مدى يقين النموذج بشأن هذا الاكتشاف. يستخدم حساب mAP درجات الثقة هذه لإنشاء منحنى الدقة-الاستدعاء.

الأدوات والمعايير

تُعد مجموعات البيانات المعيارية الموحدة أمرًا حاسمًا للنهوض بمجال اكتشاف الأجسام. تستخدم مجموعات البيانات، مثل PASCAL VOC وCOCO، mAP كمقياس أساسي لترتيب الطلبات المقدمة على لوحات الصدارة العامة. يتيح ذلك للباحثين والممارسين المقارنة الموضوعية بين النماذج المختلفة، مثل YOLOv8 و YOLO11.

وتتميز منصات مثل Ultralytics HUB بشكل بارز باستخدام mAP لمساعدة المستخدمين على تتبع الأداء أثناء تدريب النموذج والتحقق من صحته. توفر أطر التعلم العميق الأساسية التي تدعم هذه النماذج، مثل PyTorch و TensorFlow، الأدوات اللازمة لبناء وتدريب النماذج التي يتم تقييمها في النهاية باستخدام mAP.

التطبيقات الواقعية

يعد مقياس mAP أساسيًا في تطوير أنظمة ذكاء اصطناعي موثوقة.

  1. المركبات ذاتية القيادة: في مجال الذكاء الاصطناعي للسيارات ذاتية القيادة، يجب أن يكتشف نموذج الإدراك الإدراكي بدقة الأجسام المختلفة مثل السيارات والمشاة وراكبي الدراجات وإشارات المرور. تشير درجة mAP المرتفعة على مجموعة بيانات صعبة مثل Argoverse إلى أن النموذج قوي وموثوق به في جميع الفئات الحرجة، وهو أمر ضروري لضمان السلامة. وتعتمد الشركات الرائدة في هذا المجال، مثل Waymo، اعتماداً كبيراً على التقييمات الصارمة باستخدام مقاييس مثل mAP.
  2. تحليل الصور الطبية: عند تدريب نموذج لاكتشاف التشوهات مثل الأورام أو الآفات من الفحوصات باستخدام مجموعة بيانات مثل مجموعة بيانات أورام الدماغ، يتم استخدام mAP لتقييم دقة التشخيص الإجمالية. يضمن ارتفاع معدل الدقة التشخيصية التشخيصية المتوسطية أن النموذج ليس جيدًا في اكتشاف أكثر أنواع التشوهات شيوعًا فحسب، بل إنه فعال أيضًا في تحديد الحالات النادرة ولكن بنفس القدر من الأهمية. ويُعد هذا التقييم الشامل خطوة أساسية قبل النظر في نشر نموذج ما في أماكن الرعاية الصحية.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون ونمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة