Sözlük

Test Verileri

Yapay zekada test verilerinin önemini, model performansını değerlendirmedeki, aşırı uyumu tespit etmedeki ve gerçek dünya güvenilirliğini sağlamadaki rolünü keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Test verileri, Makine Öğrenimi (ML) geliştirme yaşam döngüsünün önemli bir bileşenidir. Eğitim ve ayarlama aşamaları tamamlandıktan sonra bir modelin performansının son değerlendirmesi için özel olarak kullanılan, eğitim ve doğrulama setlerinden ayrı, bağımsız bir veri kümesi anlamına gelir. Bu veri kümesi, modelin daha önce hiç karşılaşmadığı veri noktalarını içerir ve modelin yeni, gerçek dünya verileri üzerinde ne kadar iyi performans göstereceğine dair tarafsız bir değerlendirme sağlar. Test verilerini kullanmanın birincil amacı, modelin genelleme yeteneğini, yani görünmeyen girdiler üzerinde doğru performans gösterme kapasitesini tahmin etmektir.

Test Verilerinin Önemi

Bir makine öğrenimi modelinin başarısının gerçek ölçüsü, açıkça eğitilmediği verileri işleme becerisinde yatar. Test verileri, modelin performansının objektif bir değerlendirmesini sunan son kontrol noktası olarak hizmet eder. Özel bir test seti olmadan, bir modelin gürültü ve belirli kalıplar dahil olmak üzere eğitim verilerini çok iyi öğrendiği, ancak yeni verilere genelleme yapamadığı durumlarda aşırı uyum riski yüksektir. Test verilerinin kullanılması, raporlanan performans metriklerinin modelin beklenen gerçek dünya yeteneklerini yansıtmasını sağlayarak model dağıtımından önce güven oluşturmaya yardımcı olur. Bu son değerlendirme adımı, YOLOv8 ile YOLOv9'un karşılaştırılması gibi farklı modellerin veya yaklaşımların güvenilir bir şekilde karşılaştırılması için kritik öneme sahiptir.

Temel Özellikler

Test verilerinin etkili olabilmesi için belirli özelliklere sahip olması gerekir:

  • Bağımsızlık: Eğitim ve doğrulama için kullanılan verilerden kesinlikle ayrı olmalıdır. Model, eğitim veya hiperparametre ayarlama sürecinin herhangi bir bölümünde test verilerini asla görmemelidir.
  • Temsiliyet: Modelin üretimde karşılaşacağı gerçek dünya verilerinin özelliklerini ve dağılımını doğru bir şekilde yansıtmalıdır. Buna benzer girdi türleri, varyasyonlar ve potansiyel uç durumlar dahildir. Veri toplama ve en iyi açıklama uygulamaları burada hayati önem taşır.
  • Yeterli Büyüklük: Genellikle eğitim setinden daha küçük olsa da test setinin istatistiksel olarak anlamlı değerlendirme sonuçları sağlayacak kadar büyük olması gerekir. Google'ın ML Kuralları'nda vurgulandığı gibi, yetersiz bir boyut güvenilir olmayan performans tahminlerine yol açabilir.

Test Verileri ile Eğitim ve Doğrulama Verileri

Test verilerini makine öğreniminde kullanılan diğer veri bölünmelerinden ayırmak çok önemlidir:

  • Eğitim Verileri: Bu, iç parametrelerini veya ağırlıklarını ayarlayarak modeli eğitmek için doğrudan kullanılan veri kümesinin en büyük kısmıdır.
  • Doğrulama Verileri: Bu ayrı alt küme, eğitim sürecinde model hiperparametrelerini ( öğrenme hızı veya ağ mimarisi seçimleri gibi) ayarlamak ve eğitim sürecinin kendisi hakkında kararlar vermek (örn. erken durdurma) için kullanılır. Parametre güncellemeleri sırasında görünmese de hiperparametre seçimi yoluyla nihai modeli dolaylı olarak etkiler. Daha fazla ayrıntı Model Değerlendirme ve İnce Ayar kılavuzumuzda bulunabilir.
  • Test Verileri: Bu veri seti, model tamamen eğitildikten ve ayarlandıktan sonra yalnızca bir kez kullanılır ve nihai, tarafsız performans değerlendirmesini sağlar. Herhangi bir eğitim veya ayarlama kararını etkilememelidir. COCO gibi standart kıyaslama veri kümeleri genellikle standartlaştırılmış değerlendirme için önceden tanımlanmış test bölmeleriyle birlikte gelir.

Gerçek Dünyadan Örnekler

  1. Otonom Sürüş: Bir Ultralytics YOLONesne algılama (arabaları, yayaları, trafik ışıklarını algılama) için eğitilen model, eğitim veya doğrulama setlerine dahil edilmeyen koşullarda (hava durumu, günün saati, konumlar) kaydedilen yol görüntülerinden oluşan bir test seti kullanılarak değerlendirilecektir. Bu, modelin çeşitli gerçek dünya sürüş senaryolarında güvenilirliğini sağlar, bu da sürücüsüz araçlarda yapay zeka için çok önemlidir.
  2. Tıbbi Teşhis: Beyin Tümörü Tespit Veri Kümesi gibi veri kümelerini kullanarak X-ışınlarındaki tümörleri tespit etmek gibi tıbbi görüntü analizi için geliştirilen bir model, eğitim ve doğrulama için kullanılanlardan farklı hastanelerden veya tarayıcılardan alınan tamamen yeni bir hasta görüntüsü kümesi üzerinde test edilecektir. Bu, YZ'nin klinik araştırmalardaki rolünde tartışıldığı gibi, potansiyel klinik kullanımdan önce teşhis doğruluğunu teyit eder.

Test Verileri Üzerinden Performans Değerlendirmesi

Test setindeki performans genellikle doğruluk, kesinlik, geri çağırma, F1 puanı veya nesne algılama için Ortalama Kesinlik (mAP) gibi görevle ilgili ölçütler kullanılarak ölçülür. Görülmemiş test verileri üzerinde hesaplanan bu metrikler, modelin üretimdeki performansına ilişkin en gerçekçi tahmini sağlar. Bu metrikler hakkında daha fazla bilgiyi YOLO Performans Metrikleri kılavuzumuzda bulabilirsiniz. Ultralytics HUB gibi platformlar, değerlendirme aşamasında bu metriklerin izlenmesini kolaylaştırır. Model testi en iyi uygulamaları, bu son değerlendirme adımının önemini vurgulamaktadır.

Tümünü okuyun