Sözlük

Ortalama Ortalama Hassasiyet (mAP)

Kendi kendine sürüş ve sağlık hizmetleri gibi yapay zeka uygulamaları için nesne algılama modellerinin değerlendirilmesinde Ortalama Ortalama Hassasiyetin (mAP) önemini keşfedin.

Ortalama Ortalama Kesinlik (mAP), bilgisayarla görmede, özellikle nesne algılama görevlerinde yaygın olarak kullanılan kritik bir değerlendirme ölçütüdür. Tüm nesne kategorilerindeki tahminlerinin doğruluğunu ölçerek bir modelin performansını özetleyen tek ve kapsamlı bir puan sağlar. mAP puanı hem sınıflandırmanın doğruluğunu (nesne modelin söylediği şey mi?) hem de lokalizasyonun kalitesini (tahmin edilen sınırlayıcı kutu gerçek nesnenin konumuyla ne kadar iyi eşleşiyor?) hesaba katar. Dengeli bir değerlendirme sunduğu için mAP, Ultralytics YOLO gibi farklı nesne algılama modellerinin performansını karşılaştırmak için standart metrik haline gelmiştir.

mAP Nasıl Çalışır?

mAP'yi anlamak için öncelikle temel bileşenlerini kavramak faydalı olacaktır: Kesinlik, Geri Çağırma ve Birlik Üzerinden Kesişim (IoU).

  • Kesinlik: Modelin tahminlerinin ne kadar doğru olduğunu ölçer. Şu soruya cevap verir: "Modelin tespit ettiği tüm nesnelerin ne kadarı doğruydu?"
  • Hatırlama: Modelin tüm gerçek nesneleri ne kadar iyi bulduğunu ölçer. Şu soruya cevap verir: "Görüntüde bulunan tüm gerçek nesnelerin hangi kısmını model başarıyla tespit etti?"
  • Birlik üzerinde Kesişim (IoU): Tahmin edilen bir sınırlayıcı kutunun gerçek (manuel olarak etiketlenmiş) bir sınırlayıcı kutu ile ne kadar örtüştüğünü ölçen bir metriktir. IoU belirli bir eşiğin üzerindeyse (örneğin, 0,5) bir tespit genellikle gerçek pozitif olarak kabul edilir.

mAP hesaplaması bu kavramları sentezler. Her nesne sınıfı için, çeşitli güven puanı eşiklerinde kesinliğe karşı geri çağırma grafiği çizilerek bir Kesinlik-Geri Çağırma eğrisi oluşturulur. Söz konusu sınıf için Ortalama Hassasiyet (AP) bu eğrinin altındaki alandır ve modelin söz konusu sınıftaki performansını temsil eden tek bir sayı sağlar. Son olarak, mAP tüm nesne sınıflarındaki AP puanlarının ortalaması alınarak hesaplanır. Popüler COCO veri setinde olduğu gibi bazı değerlendirme şemaları, daha da sağlam bir değerlendirme sağlamak için birden fazla IoU eşiğinde mAP'nin ortalamasını alarak bunu bir adım öteye taşır.

mAP'yi Diğer Metriklerden Ayırt Etme

Diğer değerlendirme ölçütleriyle ilişkili olsa da mAP'nin farklı bir amacı vardır.

  • Doğruluk: Doğruluk, doğru tahminlerin toplam tahmin sayısına oranını ölçer. Genellikle sınıflandırma görevleri için kullanılır ve bir tahminin hem doğru şekilde sınıflandırılması hem de konumlandırılması gereken nesne algılama için uygun değildir.
  • F1-Skoru: F1-skoru, Kesinlik ve Geri Çağırma değerlerinin harmonik ortalamasıdır. Yararlı olmakla birlikte, genellikle tek bir güven eşiğinde hesaplanır. Buna karşılık, mAP tüm eşiklerdeki performansın ortalamasını alarak daha kapsamlı bir değerlendirme sağlar.
  • Güven: Bu, bir bütün olarak model için bir değerlendirme ölçütü değil, her bir tahmine atanan ve modelin o tespitten ne kadar emin olduğunu gösteren bir puandır. mAP hesaplaması, Hassasiyet-Tekrar Arama eğrisini oluşturmak için bu güven puanlarını kullanır.

Araçlar ve Ölçütler

Standartlaştırılmış kıyaslama veri kümeleri, nesne algılama alanını ilerletmek için çok önemlidir. PASCAL VOC ve COCO gibi veri kümeleri, genel liderlik tablolarındaki başvuruları sıralamak için birincil metrik olarak mAP'yi kullanır. Bu sayede araştırmacılar ve uygulayıcılar YOLOv8 ve YOLO11 gibi farklı modelleri objektif bir şekilde karşılaştırabilmektedir.

Ultralytics HUB gibi platformlar, kullanıcıların model eğitimi ve doğrulama sırasında performansı izlemelerine yardımcı olmak için mAP'yi öne çıkarmaktadır. PyTorch ve TensorFlow gibi bu modellere güç veren temel derin öğrenme çerçeveleri, sonuçta mAP kullanılarak değerlendirilen modelleri oluşturmak ve eğitmek için gerekli araçları sağlar.

Gerçek Dünya Uygulamaları

mAP metriği, güvenilir yapay zeka sistemlerinin geliştirilmesinde temel öneme sahiptir.

  1. Otonom Araçlar: Sürücüsüz araçlar için yapay zekada, bir algılama modeli arabalar, yayalar, bisikletliler ve trafik işaretleri gibi çeşitli nesneleri doğru bir şekilde algılamalıdır. Argoverse gibi zorlu bir veri kümesinde yüksek bir mAP puanı, modelin tüm kritik sınıflarda sağlam ve güvenilir olduğunu gösterir ki bu da güvenliği sağlamak için çok önemlidir. Waymo gibi bu alanda önde gelen şirketler, mAP gibi metrikler kullanarak yapılan titiz değerlendirmelere büyük ölçüde güvenmektedir.
  2. Tıbbi Görüntü Analizi: Beyin Tümörü veri kümesi gibi bir veri kümesi kullanarak taramalardan tümör veya lezyon gibi anormallikleri tespit etmek için bir modeli eğitirken, genel teşhis doğruluğunu değerlendirmek için mAP kullanılır. Yüksek bir mAP, modelin yalnızca en yaygın anomali türünü tespit etmede iyi olmasını değil, aynı zamanda daha nadir ancak aynı derecede önemli durumları belirlemede de etkili olmasını sağlar. Bu kapsamlı değerlendirme, bir modelin sağlık hizmeti ortamlarında kullanılmak üzere değerlendirilmesinden önce atılması gereken önemli bir adımdır.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve büyüyün

Şimdi katılın
Panoya kopyalanan bağlantı