Sözlük

F1-Skor

Makine öğreniminde F1-skorunun önemini keşfedin! Optimum model değerlendirmesi için hassasiyet ve geri çağırmayı nasıl dengelediğini öğrenin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

F1-Skoru, ikili veya çok sınıflı sınıflandırma modellerinin performansını değerlendirmek için makine öğrenimi (ML) ve istatistiksel analizde yaygın olarak kullanılan bir metriktir. Özellikle dengesiz veri kümeleriyle uğraşırken veya yanlış pozitifler ve yanlış negatiflerle ilişkili maliyetler önemli ölçüde farklılık gösterdiğinde, tek başına Doğruluktan daha sağlam bir değerlendirme sunarak bir modelin Kesinlik ve Geri Çağırma değerlerini tek bir ölçümde birleştirmenin bir yolunu sağlar.

Kesinlik ve Geri Çağrılmayı Anlama

F1-Skoruna geçmeden önce, bileşenlerini anlamak çok önemlidir:

  • Hassasiyet: Bu metrik şu soruyu yanıtlar: "Modelin pozitif olarak tahmin ettiği tüm örneklerden kaç tanesi gerçekten pozitifti?" Yanlış Pozitifleri (Tip I hataları) en aza indirerek pozitif tahminlerin doğruluğuna odaklanır. Yanlış pozitifin maliyeti yüksek olduğunda yüksek hassasiyet önemlidir.
  • Geri Çağırma (Hassasiyet veya Doğru Pozitif Oranı): Bu metrik şu soruya cevap verir: "Tüm gerçek pozitif örneklerden kaç tanesini model doğru şekilde tanımladı?" Yanlış Negatifleri (Tip II hataları) en aza indirerek ilgili tüm örnekleri bulmaya odaklanır. Pozitif bir örneği kaçırmak maliyetli olduğunda yüksek geri çağırma çok önemlidir.

Bu metrikler, bir karışıklık matrisinden elde edilen Doğru Pozitifler (TP), Yanlış Pozitifler (FP) ve Yanlış Negatifler (FN) sayıları kullanılarak hesaplanır.

F1-Skoru Neden Önemlidir?

Tek başına doğruluk, özellikle dengesiz veri kümelerinde yanıltıcı olabilir. Örneğin, bir veri kümesinde %95 negatif örnek ve %5 pozitif örnek varsa, her zaman "negatif" tahmininde bulunan bir model %95 doğruluk elde edecek ancak pozitif vakaları tanımlamak için işe yaramayacaktır (sıfır geri çağırma).

F1-Skoru, Kesinlik ve Hatırlama değerlerinin harmonik ortalamasını hesaplayarak bu sorunu çözmektedir. Harmonik ortalama, uç değerleri basit bir aritmetik ortalamadan daha fazla cezalandırır. Sonuç olarak, yüksek bir F1-Skoru hem yüksek hassasiyet hem de yüksek geri çağırma gerektirir ve ikisi arasında bir denge sağlar. 0 (en kötü) ile 1 (en iyi) arasında değişir.

F1-Skor Uygulamaları

F1-Skor, birçok yapay zeka ve makine öğrenimi alanında standart bir değerlendirme metriğidir:

F1-Skoru ve İlgili Metrikler

  • Doğruluk: Genel doğruluğu ölçer. Dengeli veri kümeleri için uygundur ancak dengesiz olanlar için yanıltıcıdır.
  • Kesinlik: Pozitif tahminlerin kalitesine odaklanır (FP'yi en aza indirir).
  • Geri çağırma: Bulunan gerçek pozitiflerin miktarına odaklanır (FN'yi en aza indirir).
  • Ortalama Ortalama Kesinlik (mAP): Nesne algılama ve sıralama problemlerinde yaygın bir metrik olup çeşitli geri çağırma eşikleri ve/veya sınıflar üzerinden hassasiyetin ortalamasını alır. Tipik olarak tek bir noktayı değerlendiren F1-Skorunun aksine, farklı çalışma noktalarındaki performansın daha geniş bir görünümünü sağlar.
  • Eğri Altındaki Alan (AUC): Genellikle tüm sınıflandırma eşiklerinde model performansını özetleyen ROC eğrisinin altındaki alanı ifade eder.

Doğru metriği seçmek, belirli bir probleme ve yanlış pozitiflere karşı yanlış negatifleri en aza indirmenin göreceli önemine bağlıdır. Ultralytics HUB gibi araçlar, kullanıcıların bilinçli kararlar vermelerine yardımcı olmak için model eğitimi ve değerlendirmesi sırasında F1-Score dahil olmak üzere birden fazla metriğin izlenmesine izin verir. Model değerlendirme konusunda pratik rehberlik için Ultralytics eğitimlerini keşfedin.

Tümünü okuyun