مسرد المصطلحات

النتيجة F1-نتيجة

اكتشف أهمية النتيجة F1 في التعلم الآلي! تعلّم كيف يوازن بين الدقة والاستدعاء من أجل التقييم الأمثل للنموذج.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

F1-Score هو مقياس يُستخدم على نطاق واسع في التعلّم الآلي (ML) والتحليل الإحصائي لتقييم أداء نماذج التصنيف الثنائية أو متعددة الفئات. وهو يوفر طريقة للجمع بين دقة النموذج واستدعائه في مقياس واحد، مما يوفر تقييمًا أكثر قوة من الدقة وحدها، خاصةً عند التعامل مع مجموعات البيانات غير المتوازنة أو عندما تختلف التكاليف المرتبطة بالإيجابيات الخاطئة والسلبيات الخاطئة بشكل كبير.

فهم الدقة والاسترجاع

قبل الغوص في نقاط F1-Score، من الضروري فهم مكوناتها:

  • الدقة: يجيب هذا المقياس على السؤال: "من بين جميع الحالات التي تنبأ النموذج بأنها إيجابية، كم عدد الحالات التي كانت إيجابية بالفعل؟ وهو يركز على صحة التنبؤات الإيجابية، وتقليل الحالات الإيجابية الخاطئة (الأخطاء من النوع الأول). تُعد الدقة العالية مهمة عندما تكون تكلفة التنبؤات الإيجابية الخاطئة عالية.
  • التذكر (الحساسية أو المعدل الإيجابي الحقيقي): يجيب هذا المقياس على السؤال "من بين جميع الحالات الإيجابية الفعلية، كم عدد الحالات الإيجابية الفعلية التي حددها النموذج بشكل صحيح؟ وهو يركز على العثور على جميع الحالات ذات الصلة، مما يقلل من الحالات السلبية الكاذبة (أخطاء النوع الثاني). يعد الاستدعاء المرتفع أمرًا بالغ الأهمية عندما يكون فقدان مثيل إيجابي مكلفًا.

يتم حساب هذه المقاييس باستخدام أعداد الإيجابيات الصحيحة (TP) والإيجابيات الخاطئة (FP) والسلبيات الخاطئة (FN) المستمدة من مصفوفة الارتباك.

لماذا تعتبر درجة F1 مهمة

قد تكون الدقة وحدها مضللة، خاصةً مع مجموعات البيانات غير المتوازنة. على سبيل المثال، إذا كانت مجموعة البيانات تحتوي على 95% من الحالات السلبية و5% من الحالات الإيجابية، فإن النموذج الذي يتنبأ دائمًا بالحالات السلبية سيحقق دقة بنسبة 95% ولكنه سيكون عديم الفائدة في تحديد الحالات الإيجابية (استدعاء صفر).

تعالج F1-Score هذا الأمر من خلال حساب المتوسط التوافقي للدقة والاسترجاع. يعاقب المتوسط التوافقي القيم المتطرفة أكثر من المتوسط الحسابي البسيط. وبالتالي، تتطلب النتيجة F1-Score العالية دقة عالية واستدعاءً عاليًا، مما يضمن التوازن بين الاثنين. وهو يتراوح من 0 (الأسوأ) إلى 1 (الأفضل).

تطبيقات F1-Score

F1-Score هو مقياس تقييم قياسي في العديد من مجالات الذكاء الاصطناعي والتعلم الآلي:

النتيجة F1 مقابل المقاييس ذات الصلة

  • الدقة: يقيس الدقة الإجمالية. مناسبة لمجموعات البيانات المتوازنة، ولكنها مضللة لمجموعات البيانات غير المتوازنة.
  • الدقة: يركز على جودة التنبؤات الإيجابية (تقليل FP).
  • التذكير: يركز على كمية الإيجابيات الفعلية التي تم العثور عليها (تقليل FN).
  • متوسط متوسط الدقة (mAP): مقياس شائع في مشاكل الكشف عن الكائنات وترتيبها، حيث يقوم بمتوسط الدقة على عتبات الاستدعاء المختلفة و/أو الفئات. وهو يوفر رؤية أوسع للأداء عبر نقاط تشغيل مختلفة، على عكس F1-Score الذي يقيّم عادةً نقطة واحدة.
  • المساحة تحت المنحنى (AUC): غالبًا ما تشير إلى المساحة تحت منحنى ROC، وتلخص أداء النموذج عبر جميع عتبات التصنيف.

يعتمد اختيار المقياس الصحيح على المشكلة المحددة والأهمية النسبية لتقليل الإيجابيات الخاطئة مقابل السلبيات الخاطئة. تسمح أدوات مثل Ultralytics HUB بتتبع مقاييس متعددة، بما في ذلك F1-Score، أثناء تدريب النموذج وتقييمه لمساعدة المستخدمين على اتخاذ قرارات مستنيرة. استكشف دروسUltralytics التعليمية للحصول على إرشادات عملية حول تقييم النموذج.

قراءة الكل