Makine öğreniminde F1-skorunun önemini keşfedin! Optimum model değerlendirmesi için hassasiyet ve geri çağırmayı nasıl dengelediğini öğrenin.
F1-Skoru, ikili veya çok sınıflı sınıflandırma modellerinin performansını değerlendirmek için makine öğrenimi (ML) ve istatistiksel analizde yaygın olarak kullanılan bir metriktir. Özellikle dengesiz veri kümeleriyle uğraşırken veya yanlış pozitifler ve yanlış negatiflerle ilişkili maliyetler önemli ölçüde farklılık gösterdiğinde, tek başına Doğruluktan daha sağlam bir değerlendirme sunarak bir modelin Kesinlik ve Geri Çağırma değerlerini tek bir ölçümde birleştirmenin bir yolunu sağlar.
F1-Skoruna geçmeden önce, bileşenlerini anlamak çok önemlidir:
Bu metrikler, bir karışıklık matrisinden elde edilen Doğru Pozitifler (TP), Yanlış Pozitifler (FP) ve Yanlış Negatifler (FN) sayıları kullanılarak hesaplanır.
Tek başına doğruluk, özellikle dengesiz veri kümelerinde yanıltıcı olabilir. Örneğin, bir veri kümesinde %95 negatif örnek ve %5 pozitif örnek varsa, her zaman "negatif" tahmininde bulunan bir model %95 doğruluk elde edecek ancak pozitif vakaları tanımlamak için işe yaramayacaktır (sıfır geri çağırma).
F1-Skoru, Kesinlik ve Hatırlama değerlerinin harmonik ortalamasını hesaplayarak bu sorunu çözmektedir. Harmonik ortalama, uç değerleri basit bir aritmetik ortalamadan daha fazla cezalandırır. Sonuç olarak, yüksek bir F1-Skoru hem yüksek hassasiyet hem de yüksek geri çağırma gerektirir ve ikisi arasında bir denge sağlar. 0 (en kötü) ile 1 (en iyi) arasında değişir.
F1-Skor, birçok yapay zeka ve makine öğrenimi alanında standart bir değerlendirme metriğidir:
Doğru metriği seçmek, belirli bir probleme ve yanlış pozitiflere karşı yanlış negatifleri en aza indirmenin göreceli önemine bağlıdır. Ultralytics HUB gibi araçlar, kullanıcıların bilinçli kararlar vermelerine yardımcı olmak için model eğitimi ve değerlendirmesi sırasında F1-Score dahil olmak üzere birden fazla metriğin izlenmesine izin verir. Model değerlendirme konusunda pratik rehberlik için Ultralytics eğitimlerini keşfedin.