Sözlük

Test Verileri

Yapay zekada test verilerinin önemini, model performansını değerlendirmedeki, aşırı uyumu tespit etmedeki ve gerçek dünya güvenilirliğini sağlamadaki rolünü keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Test verileri, Makine Öğrenimi (ML) geliştirme yaşam döngüsünün önemli bir bileşenidir. Eğitim ve ayarlama aşamaları tamamlandıktan sonra bir modelin performansının son değerlendirmesi için özel olarak kullanılan, eğitim ve doğrulama setlerinden ayrı, bağımsız bir veri kümesi anlamına gelir. Bu veri kümesi, modelin daha önce hiç karşılaşmadığı veri noktalarını içerir ve modelin yeni, gerçek dünya verileri üzerinde ne kadar iyi performans göstereceğine dair tarafsız bir değerlendirme sağlar. Test verilerini kullanmanın birincil amacı, modelin genelleme yeteneğini, yani görünmeyen girdiler üzerinde doğru performans gösterme kapasitesini tahmin etmektir.

Test Verilerinin Önemi

Bir makine öğrenimi modelinin başarısının gerçek ölçüsü, açıkça eğitilmediği verileri işleme becerisinde yatar. Test verileri, modelin performansının objektif bir değerlendirmesini sunan son kontrol noktası olarak hizmet eder. Özel bir test seti olmadan, bir modelin gürültü ve belirli kalıplar dahil olmak üzere eğitim verilerini çok iyi öğrendiği, ancak yeni verilere genelleme yapamadığı durumlarda aşırı uyum riski yüksektir. Test verilerinin kullanılması, raporlanan performans metriklerinin modelin beklenen gerçek dünya yeteneklerini yansıtmasını sağlayarak model dağıtımından önce güven oluşturmaya yardımcı olur. Bu son değerlendirme adımı, YOLOv8 ile YOLOv9' un karşılaştırılması gibi farklı modellerin veya yaklaşımların güvenilir bir şekilde karşılaştırılması için kritik öneme sahiptir ve Google'ın ML Kurallarında özetlenenler gibi en iyi uygulamalarla uyumludur.

Temel Özellikler

Test verilerinin etkili olabilmesi için belirli özelliklere sahip olması gerekir:

  • Temsil edilebilirlik: Modelin dağıtımdan sonra karşılaşacağı gerçek dünya verilerinin özelliklerini doğru bir şekilde yansıtmalıdır. Bu, özelliklerin, sınıfların ve potansiyel varyasyonların benzer dağılımlarını içerir. İyi veri toplama ve açıklama uygulamaları esastır.
  • Bağımsızlık: Test verileri, eğitim ve doğrulama setlerinden kesinlikle ayrı olmalıdır. Modeli eğitmek veya hiperparametrelerini ayarlamak için asla kullanılmamalıdır. Herhangi bir çakışma veya sızıntı, aşırı iyimser performans tahminlerine yol açabilir.
  • Yeterli Büyüklük: Test setinin istatistiksel olarak anlamlı sonuçlar sağlayacak ve modelin performansını güvenilir bir şekilde tahmin edecek kadar büyük olması gerekir.

Test Verileri ile Eğitim ve Doğrulama Verileri

Test verilerini makine öğreniminde kullanılan diğer veri bölünmelerinden ayırmak çok önemlidir:

  • Eğitim Verileri: Bu, doğrudan modeli eğitmek için kullanılan veri kümesinin en büyük kısmıdır. Model, Denetimli Öğrenme gibi algoritmalar aracılığıyla bu verilerden kalıpları ve ilişkileri öğrenir.
  • Doğrulama Verileri: Bu ayrı veri kümesi, eğitim aşamasında model hiperparametrelerini (mimari seçimleri veya optimizasyon ayarları gibi) ayarlamak ve eğitim süreci hakkında kararlar almak (örneğin, erken durdurma) için kullanılır. Modelin eğitim sırasında ne kadar iyi genelleme yaptığına dair geri bildirim sağlayarak nihai test setini kullanmadan model değerlendirme ve ince ayar sürecine rehberlik eder.
  • Test Verileri: Modelin görünmeyen veriler üzerindeki performansının nihai ve tarafsız bir değerlendirmesini sağlamak için tüm eğitim ve doğrulama tamamlandıktan sonra yalnızca bir kez kullanılır.

Bu veri kümelerini dikkatli veri bölme gibi stratejiler kullanarak düzgün bir şekilde ayırmak, güvenilir modeller geliştirmek ve gerçek dünyadaki yeteneklerini doğru bir şekilde değerlendirmek için çok önemlidir.

Gerçek Dünyadan Örnekler

  1. Otonom Sürüş: Bir Ultralytics YOLOsürücüsüz araç larda nesne tespiti için eğitilen model, daha önce görülmemiş çeşitli sürüş senaryolarını (örneğin gece sürüşü, şiddetli yağmur, bilinmeyen kavşaklar) içeren bir test seti üzerinde değerlendirilecektir. Bu, modelin gerçek araçlara yerleştirilmeden önce yayaları, bisikletlileri ve diğer araçları(Waymo'nun teknolojisi büyük ölçüde bu tür testlere dayanmaktadır) güvenilir bir şekilde algılamasını sağlar.
  2. Tıbbi Teşhis: Tıbbi görüntü analizinde, Beyin Tümörü Tespit Veri Seti gibi verileri kullanarak tümörleri tespit etmek için eğitilen bir model, eğitim veya doğrulamanın bir parçası olmayan farklı hastanelerden, makinelerden ve hasta popülasyonlarından alınan taramalardan oluşan bir test seti üzerinde değerlendirilmelidir. Bu, modelin gerçek klinik ortamlarda tanısal doğruluğunu ve sağlamlığını teyit eder.

Değerlendirme ve Yönetim

Test setindeki performans genellikle doğruluk, Ortalama Hassasiyet (mAP) gibi görevle ilgili metrikler veya YOLO Performans Metrikleri belgeleri gibi kılavuzlarda ayrıntılı olarak açıklanan diğer metrikler kullanılarak ölçülür. Genellikle modeller, adil karşılaştırmalar sağlamak ve tekrarlanabilirliği teşvik etmek için COCO gibi yerleşik kıyaslama veri kümelerine göre değerlendirilir. Proje yaşam döngüsü boyunca bu farklı veri kümelerini yönetmek, veri bölmelerini düzenlemeye ve deneyleri etkili bir şekilde izlemeye yardımcı olan Ultralytics HUB gibi platformlar tarafından kolaylaştırılır.

Tümünü okuyun