ML model değerlendirmesinde Eğri Altındaki Alanın (AUC) önemini öğrenin. Faydalarını, ROC eğrisi içgörülerini ve gerçek dünya uygulamalarını keşfedin.
Eğri Altındaki Alan (AUC), öncelikle makine öğreniminde (ML) ikili sınıflandırma modellerini değerlendirmek için kullanılan temel bir performans ölçütüdür. Bir modelin tüm olası sınıflandırma eşiklerinde pozitif ve negatif sınıflar arasında ayrım yapma yeteneğini ölçer. AUC puanları 0 ile 1 arasında değişir ve daha yüksek değerler daha iyi model performansına işaret eder. 0,5 puan alan bir model rastgele şanstan daha iyi performans göstermezken, sınıfları kusursuz bir şekilde ayıran mükemmel bir model 1,0 AUC elde eder. Bu metrik, herhangi bir özel eşik seçiminden bağımsız olarak sınıflandırma performansının tek ve toplu bir ölçüsünü sağlar.
AUC değeri doğrudan Alıcı İşletim Karakteristiği (ROC) eğrisinden elde edilir. ROC eğrisi, ayrımcılık eşiği değiştikçe ikili bir sınıflandırıcının teşhis kabiliyetini gösteren grafiksel bir çizimdir. Hassasiyet veya Geri Çağırma olarak da bilinen Doğru Pozitif Oranı (TPR) y ekseninde, Yanlış Pozitif Oranı (FPR) x ekseninde çeşitli eşik ayarlarında çizer. AUC, bu ROC eğrisinin altındaki iki boyutlu alanın tamamını temsil eder. ROC eğrilerine kapsamlı bir genel bakış Wikipedia'da bulunabilir.
AUC, bir modelin rastgele seçilen pozitif bir örneği rastgele seçilen negatif bir örnekten daha yüksek sıralama olasılığı olarak yorumlanır. Bu da onu modelin genel ayırt edici gücünün bir ölçüsü haline getirir. AUC'nin en önemli avantajlarından biri, Doğruluk gibi ölçütlere kıyasla sınıf dengesizliğine karşı göreceli duyarsızlığıdır. Bir sınıfın diğerinden çok daha fazla olduğu veri kümelerinde (gerçek dünya problemlerinde yaygın bir senaryo), doğruluk yanıltıcı olabilirken, AUC modelin sınıfları ne kadar iyi ayırdığına dair daha sağlam bir ölçü sağlar. 1'e yakın bir AUC, mükemmel ayrılabilirliğe sahip bir modeli gösterirken, 0,5'e yakın bir AUC, rastgele tahmine benzer şekilde zayıf ayrımcılık yeteneğine işaret eder. Bu yorumların anlaşılması, etkili model değerlendirmesi için çok önemlidir.
AUC, ikili sınıflandırma görevlerinin kritik olduğu çeşitli alanlarda yaygın olarak kullanılmaktadır. İşte iki örnek:
Aşağıdakiler de dahil olmak üzere birçok derin öğrenme (DL) çerçevesi ve kütüphanesi PyTorch ve TensorFlowbu sınıflandırıcıları oluşturmak için kullanılır. Scikit-learn gibi araçlar, ROC AUC puanlarını hesaplamak için uygun işlevler sunarak değerlendirme sürecini basitleştirir. Ultralytics HUB gibi platformlar da bu tür metriklerin ilgili olduğu modellerin eğitimini ve değerlendirilmesini kolaylaştırır.
AUC değerli bir ölçüt olsa da, bilgisayarla görme (CV) ve makine öğrenimi alanlarında kullanılan diğer değerlendirme ölçütlerinden ne kadar farklı olduğunu anlamak önemlidir:
Doğru metriğin seçilmesi belirli bir probleme, veri kümesi özelliklerine (sınıf dengesi gibi) ve YZ projesinin hedeflerine bağlıdır. AUC, sağlamlığı ve yorumlanabilirliği nedeniyle ikili sınıflandırma performansını değerlendirmek için bir köşe taşı olmaya devam etmektedir.