Veri artırmanın model sağlamlığını nasıl iyileştirdiğini ve aşırı uyumu nasıl azalttığını keşfedin. Bilgisayar görüşü için Ultralytics performansını artırmak için temel teknikleri öğrenin.
Veri artırma, makine öğrenimi ve bilgisayar görüşünde, mevcut verilerin değiştirilmiş versiyonlarını oluşturarak eğitim veri setinin boyutunu ve çeşitliliğini yapay olarak artırmak için kullanılan kritik bir tekniktir. Zaman alıcı ve pahalı olabilen tamamen yeni verileri toplamak ve etiketlemek yerine, artırma, orijinal örnekler üzerinde çeşitli dönüşümler uygular. Bu değişiklikler, makine öğrenimi modellerinin kalıpları daha sağlam bir şekilde tanımayı öğrenmesine yardımcı olur ve gerçek dünya ortamlarında değişikliklerle karşılaşıldığında bile iyi performans göstermelerini sağlar. Eğitim sırasında modelleri daha geniş bir senaryo yelpazesine maruz bırakarak, geliştiriciler aşırı uyumu etkili bir şekilde azaltabilir ve genellemeyi iyileştirebilir.
Bilgisayar görme alanında, modeller genellikle eğitim verilerinden biraz farklı görüntülerle karşılaştıklarında zorluk çekerler. Aydınlatma, yönelim veya arka plan karmaşasındaki değişiklikler, yeterince çeşitlilik görmemiş bir modeli karıştırabilir. Veri artırma, bu değişiklikleri programlı olarak simüle ederek bu sorunu çözer. Örneğin, bir kedi görüntüsü döndürülebilir, ters çevrilebilir veya hafifçe bulanıklaştırılabilir, böylece modele bu değişikliklerden bağımsız olarak nesnenin "kedi" olarak kaldığı öğretilebilir.
Bu süreç, nesne algılama ve görüntü segmentasyonu gibi görevlerde yüksek doğruluk elde etmek için zengin ve çeşitli veri kümelerine dayanan Ultralytics gibi modern mimarilerin başarısının ayrılmaz bir parçasıdır. Yeni eğitim örneklerini sentezleyerek, artırma, modellerin değişmez özellikleri, yani girdideki değişikliklere rağmen değişmeyen özellikleri öğrenmesini sağlar.
Veri artırma, basit geometrik ayarlamalardan karmaşık üretken yaklaşımlara kadar geniş bir yelpazede dönüşüm tekniklerini kapsar: karmaşık üretken yaklaşımlar:
Veri artırmanın pratik etkisi, veri kıtlığı veya yüksek değişkenliğin bir sorun olduğu birçok sektörü kapsamaktadır. .
Otonom araçların geliştirilmesinde, her türlü hava koşulu veya aydınlatma senaryosu için veri toplamak neredeyse imkansızdır. Mühendisler, veri artırma yöntemini kullanarak yağmur, sis, kar veya parlamayı açık hava görüntülerinde simüle ederler. Bu, algılama sisteminin çevresel faktörlerden bağımsız olarak detect , trafik işaretlerini ve diğer araçları güvenilir bir şekilde detect sağlayarak güvenliği ve güvenilirliği artırır.
Tıbbi görüntü analizi, gizlilik endişeleri ve belirli durumların nadirliği nedeniyle genellikle sınırlı veri setlerinden muzdariptir. Artırma, araştırmacıların elastik deformasyonlar, rotasyonlar veya yoğunluk kaymaları uygulayarak küçük X-ray veya MRI tarama veri setlerini genişletmelerine olanak tanır. Bu , hasta pozisyonu veya tarama kalitesi değiştiğinde bile tümörleri veya kırıkları yüksek hassasiyetle tanımlayabilen sağlam teşhis modellerinin eğitilmesine yardımcı olur.
Veri artırımı ile Sentetik Veri arasında ayrım yapmak önemlidir. Her ikisi de veri kümesinin boyutunu artırmayı amaçlasa da, sentetik veri sıfırdan yapay olarak üretilir (genellikle 3D render veya simülasyon motorları kullanılarak), veri artırımı ise mevcut gerçek dünya verilerini değiştirir . Ek olarak, Veri Ön İşleme, verileri bir modele uygun hale getirmek için temizleme ve biçimlendirme (örneğin, yeniden boyutlandırma, normalleştirme) içerir, ancak artırmadan farklı olarak, eğitim örneklerinin sayısını artırması gerekmez.
Modern çerçeveler, artırmayı doğrudan eğitim sürecine entegre eder. Aşağıdaki örnek, YOLO26 modelinin eğitimi sırasında
dönüştürme ve ölçeklendirme gibi artırmaların nasıl uygulanacağını gösterir.
ultralytics Paket.
from ultralytics import YOLO
# Load the YOLO26 model
model = YOLO("yolo26n.pt")
# Train with custom data augmentation hyperparameters
# fliplr: 50% chance of horizontal flip, scale: image scaling gain
results = model.train(data="coco8.yaml", epochs=10, fliplr=0.5, scale=0.5)
Bu hiperparametreleri ayarlayarak, geliştiriciler artırma stratejisini veri kümelerinin ve uygulamalarının özel ihtiyaçlarına göre uyarlayabilirler. Ultralytics esnekliğinden yararlanarak verimli model geliştirme gerçekleştirebilirler.