تعرّف على كيفية تقييم منحنيات ROC و AUC لأداء المصنف في الذكاء الاصطناعي/التشغيل الآلي، وتحسين أداء المصنف في مهام مثل اكتشاف الاحتيال والتشخيص الطبي.
منحنى خصائص التشغيل المستقبِل (ROC) هو مخطط بياني يُستخدم لتوضيح القدرة التشخيصية لنظام تصنيف ثنائي مع تغير عتبة التمييز الخاصة به. وهو يساعد على تصور مدى قدرة نموذج التعلّم الآلي على التمييز بين فئتين (على سبيل المثال، إيجابية مقابل سلبية، أو بريد مزعج مقابل غير مزعج). يتم إنشاء المنحنى من خلال رسم المعدل الإيجابي الحقيقي (TPR) مقابل المعدل الإيجابي الخاطئ (FPR) في إعدادات عتبة مختلفة. يعد فهم منحنيات ROC أمرًا بالغ الأهمية لتقييم ومقارنة أداء نماذج التصنيف، خاصةً في مجالات مثل تحليل الصور الطبية والتعرف على الأنماط.
لتفسير منحنى ROC، من الضروري فهم محاوره:
يوضّح منحنى ROC المفاضلة بين معدل العائد الكلي ومعدل العائد على النتائج. مع تغيّر عتبة التصنيف، قد يحدد النموذج المزيد من النتائج الإيجابية الحقيقية (زيادة معدل العائد على النتائج الحقيقية) ولكن من المحتمل أن يكون ذلك على حساب تحديد المزيد من النتائج الإيجابية الخاطئة (زيادة معدل العائد على النتائج الخاطئة).
يوفر شكل منحنى ROC نظرة ثاقبة على أداء النموذج:
المقياس الشائع المشتق من منحنى ROC هو المساحة تحت المنحنى (AUC). يوفر AUC قيمة قياسية واحدة تلخص أداء المصنف عبر جميع العتبات الممكنة. وتمثل قيمة AUC التي تبلغ 1.0 مصنفًا مثاليًا، بينما تشير قيمة AUC التي تبلغ 0.5 إلى نموذج ذي أداء عشوائي. توفر أدوات مثل Scikit-learn وظائف لحساب AUC.
تُستخدم منحنيات ROC على نطاق واسع في مجالات مختلفة:
في حين أن مقاييس مثل الدقة والدقة والاسترجاع توفر معلومات قيّمة، فإن منحنى ROC و AUC يقدمان رؤية أكثر شمولاً، خاصةً مع مجموعات البيانات غير المتوازنة حيث تفوق إحدى الفئتين الفئة الأخرى بشكل كبير. يمكن أن تكون الدقة مضللة في مثل هذه السيناريوهات لأنه قد يتم تحقيق درجة عالية من خلال التنبؤ بفئة الأغلبية. يوفر منحنى ROC، الذي يركز على المفاضلة بين الدقة والدقة في التوقع، تقييمًا مستقلًا عن العتبة لقدرة النموذج على التمييز بين الفئات. للحصول على رؤى مفصلة حول تقييم نماذج مثل Ultralytics YOLO راجع دليلنا حول مقاييس أداءYOLO . يمكن إجراء تصور هذه المقاييس غالبًا باستخدام أدوات مدمجة مع منصات مثل Ultralytics HUB أو مكتبات مثل TensorBoard.