Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Doğrulama Verisi

Doğrulama verilerinin model genelleştirmesini nasıl iyileştirdiğini keşfedin. Ultralytics ince ayarlamayı, aşırı uyumu önlemeyi ve en yüksek mAP için hiperparametreleri optimize etmeyi öğrenin.

Doğrulama verileri, makine öğrenimi geliştirme yaşam döngüsünde kritik bir kontrol noktası görevi görür ve eğitim sırasında modelin performansını değerlendirmek için kullanılan ara veri kümesi olarak hizmet eder. Algoritmayı öğretmek için kullanılan birincil veri kümesinden farklı olarak , doğrulama kümesi, sistemin yeni, görülmemiş bilgileri genelleştirmeyi ne kadar iyi öğrendiğine dair tarafsız bir tahmin sağlar . Geliştiriciler, bu belirli alt kümedeki metrikleri izleyerek modelin yapılandırmasını ince ayar yapabilir ve sistemin temel kalıpları anlamak yerine eğitim örneklerini ezberlediği aşırı uyum gibi potansiyel sorunları belirleyebilir. Bu geri bildirim döngüsü, gerçek dünyada güvenilir bir şekilde çalışan sağlam yapay zeka (AI) çözümleri oluşturmak için çok önemlidir.

Hiperparametre Ayarlamada Doğrulamanın Rolü

Doğrulama verilerinin temel işlevi, hiperparametrelerin optimizasyonunu kolaylaştırmaktır. Model ağırlıkları gibi iç parametreler, eğitim süreci boyunca otomatik olarak öğrenilirken, öğrenme oranı, toplu iş boyutu ve ağ mimarisi gibi hiperparametreler manuel olarak ayarlanmalı veya deneyler yoluyla keşfedilmelidir.

Doğrulama verileri, mühendislerin model seçimi yoluyla farklı yapılandırmaları etkili bir şekilde karşılaştırmasına olanak tanır. Örneğin, bir geliştirici YOLO26 modelini eğitiyorsa, üç farklı öğrenme oranını test edebilir. Doğrulama setinde en yüksek doğruluğu sağlayan sürüm genellikle seçilir. Bu süreç, önyargı-varyans dengesi arasında gezinmeye yardımcı olur ve modelin verilerin nüanslarını yakalayacak kadar karmaşık, ancak genelleştirilebilir kalacak kadar basit olmasını sağlar.

Veri Bölmeleri Arasında Ayırt Etme

Bilimsel titizliği sağlamak için, tam bir veri kümesi genellikle üç ayrı alt kümeye bölünür. Her birinin benzersiz amacını anlamak, etkili veri yönetimi için hayati önem taşır.

  • Eğitim Verileri: Bu, veri kümesinin en büyük kısmıdır ve modeli uydurmak için doğrudan kullanılır. Algoritma, bu örnekleri işleyerek geri yayılım yoluyla iç parametrelerini ayarlar.
  • Doğrulama Verileri: Bu alt küme, eğitim sürecinde sık sık değerlendirme sağlamak için kullanılır. Önemli olan, modelin bu verilere dayanarak ağırlıklarını asla doğrudan güncellememesidir; bu verileri yalnızca model seçimi ve erken durdurma kararlarına rehberlik etmek için kullanır.
  • Test Verileri: Nihai model yapılandırması seçildikten sonra kullanılan, tamamen gizli tutulan veri kümesi. Model dağıtım performansının gerçekçi bir ölçütünü sağlamak için "final sınavı" görevi görür. model dağıtım performansı.

Ultralytics ile Pratik Uygulama

Ultralytics , bir modeli doğrulamak basitleştirilmiş bir süreçtir. Bir kullanıcı eğitimi veya doğrulamayı başlattığında, çerçeve otomatik olarak veri kümesinin YAML yapılandırmasında belirtilen görüntüleri kullanır. Bu, anahtar performans göstergelerini hesaplar Ortalama Ortalama Hassasiyet (mAP) gibi, kullanıcıların nesne algılama veya segmentasyon görevlerinin doğruluğunu ölçmelerine yardımcı olur.

Aşağıdaki örnek, Python kullanarak standart COCO8 inde önceden eğitilmiş bir YOLO26 modelini nasıl doğrulayacağınızı göstermektedir:

from ultralytics import YOLO

# Load the YOLO26 model (recommended for state-of-the-art performance)
model = YOLO("yolo26n.pt")

# Validate the model using the 'val' mode
# The 'data' argument points to the dataset config containing the validation split
metrics = model.val(data="coco8.yaml")

# Print the Mean Average Precision at IoU 0.5-0.95
print(f"Validation mAP50-95: {metrics.box.map}")

Gerçek Dünya Uygulamaları

Doğrulama verileri, hassasiyet ve güvenilirliğin vazgeçilmez olduğu çeşitli sektörlerde vazgeçilmezdir.

  • Akıllı Tarım: Tarımda yapay zeka alanında, sistemler detect hastalıklarını detect veya büyüme aşamalarını izlemek için eğitilir. Çeşitli hava koşullarında (güneşli, bulutlu, yağmurlu) çekilen görüntüleri içeren bir doğrulama seti, modelin sadece mükemmel, güneşli günlerde çalışmamasını sağlar. Doğrulama puanlarına göre veri artırma stratejilerini ayarlayarak, çiftçiler çevresel değişkenlikten bağımsız olarak tutarlı bilgiler elde ederler.
  • Tıbbi Teşhis: CT taramalarında tümörleri tanımlamak gibi tıbbi görüntü analizi için çözümler geliştirirken, doğrulama verileri modelin bir hastanenin ekipmanına özgü önyargıları öğrenmesini önlemeye yardımcı olur. Çeşitli hasta demografileri üzerinde yapılan titiz doğrulama, teşhis araçlarının FDA'nın dijital sağlık kılavuzları gibi düzenleyici kurumların gerektirdiği güvenlik standartlarını karşıladığından emin olunmasını sağlar.

İleri Teknikler: Çapraz Doğrulama

Verilerin yetersiz olduğu senaryolarda, doğrulama için özel olarak %20'lik bir pay ayırmak, çok fazla değerli eğitim bilgisinin kaybolmasına neden olabilir. Bu gibi durumlarda, uygulayıcılar genellikle Çapraz Doğrulama, özellikle de K-Kat Çapraz Doğrulama yöntemini kullanırlar. Bu teknik, verilerin 'K' alt kümesine bölünmesini ve hangi alt kümenin doğrulama verisi olarak kullanılacağının dönüşümlü olarak belirlenmesini içerir. Bu, her veri noktasının hem eğitim hem de doğrulama için kullanılmasını sağlayarak, istatistiksel öğrenme teorisinde açıklanan model performansının istatistiksel olarak daha sağlam bir tahminini sağlar.

Doğrulama verilerinin etkili kullanımı, profesyonel Makine Öğrenimi Operasyonlarının (MLOps) temel taşıdır. Ultralytics gibi araçlardan yararlanarak, ekipler bu veri kümelerinin yönetimini otomatikleştirebilir ve modellerin üretime geçmeden önce titizlikle test edilip optimize edilmesini sağlayabilirler .

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın