Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Veri Artırma

Veri artırmanın model sağlamlığını nasıl iyileştirdiğini ve aşırı uyumu nasıl azalttığını keşfedin. Bilgisayar görüşü için Ultralytics performansını artırmak için temel teknikleri öğrenin.

Veri artırma, makine öğrenimi ve bilgisayar görüşünde, mevcut verilerin değiştirilmiş versiyonlarını oluşturarak eğitim veri setinin boyutunu ve çeşitliliğini yapay olarak artırmak için kullanılan kritik bir tekniktir. Zaman alıcı ve pahalı olabilen tamamen yeni verileri toplamak ve etiketlemek yerine, artırma, orijinal örnekler üzerinde çeşitli dönüşümler uygular. Bu değişiklikler, makine öğrenimi modellerinin kalıpları daha sağlam bir şekilde tanımayı öğrenmesine yardımcı olur ve gerçek dünya ortamlarında değişikliklerle karşılaşıldığında bile iyi performans göstermelerini sağlar. Eğitim sırasında modelleri daha geniş bir senaryo yelpazesine maruz bırakarak, geliştiriciler aşırı uyumu etkili bir şekilde azaltabilir ve genellemeyi iyileştirebilir.

Modern Yapay Zekada Alaka Düzeyi

Bilgisayar görme alanında, modeller genellikle eğitim verilerinden biraz farklı görüntülerle karşılaştıklarında zorluk çekerler. Aydınlatma, yönelim veya arka plan karmaşasındaki değişiklikler, yeterince çeşitlilik görmemiş bir modeli karıştırabilir. Veri artırma, bu değişiklikleri programlı olarak simüle ederek bu sorunu çözer. Örneğin, bir kedi görüntüsü döndürülebilir, ters çevrilebilir veya hafifçe bulanıklaştırılabilir, böylece modele bu değişikliklerden bağımsız olarak nesnenin "kedi" olarak kaldığı öğretilebilir.

Bu süreç, nesne algılama ve görüntü segmentasyonu gibi görevlerde yüksek doğruluk elde etmek için zengin ve çeşitli veri kümelerine dayanan Ultralytics gibi modern mimarilerin başarısının ayrılmaz bir parçasıdır. Yeni eğitim örneklerini sentezleyerek, artırma, modellerin değişmez özellikleri, yani girdideki değişikliklere rağmen değişmeyen özellikleri öğrenmesini sağlar.

Yaygın Teknikler ve Yöntemler

Veri artırma, basit geometrik ayarlamalardan karmaşık üretken yaklaşımlara kadar geniş bir yelpazede dönüşüm tekniklerini kapsar: karmaşık üretken yaklaşımlar:

  • Geometrik Dönüşümler: Bunlar, görüntüleri döndürme, ölçeklendirme, çevirme, kırpma ve kaydırma (yer değiştirme) gibi işlemleri içerir. Bunlar, kameranın bakış açısındaki veya nesnenin konumundaki değişiklikleri temsil eder.
  • Renk Alanı Ayarlamaları: Parlaklık, kontrast, doygunluk ve renk tonunu değiştirmek, modellerin farklı aydınlatma koşulları veya kamera sensörleriyle başa çıkmasına yardımcı olur.
  • Gürültü Enjeksiyonu: Rastgele gürültü (Gauss gürültüsü gibi) eklemek, modelleri grenli veya düşük kaliteli girdi verilerine karşı daha dayanıklı hale getirebilir.
  • Görüntüleri Karıştırma: MixUp Mosaic ( YOLO popüler) gibi teknikler, birden fazla görüntüyü tek bir eğitim örneğinde birleştirerek, modelin bağlam ve nesne ilişkilerini daha etkili bir şekilde öğrenmesini sağlar.
  • Üretken Yaklaşımlar: Gelişmiş yöntemler, Üretken AI veya difüzyon modellerini kullanarak, orijinal veri kümesinin özelliklerini taklit eden tamamen yeni, sentetik eğitim örnekleri oluşturur.

Gerçek Dünya Uygulamaları

Veri artırmanın pratik etkisi, veri kıtlığı veya yüksek değişkenliğin bir sorun olduğu birçok sektörü kapsamaktadır. .

Otonom Sürüş

Otonom araçların geliştirilmesinde, her türlü hava koşulu veya aydınlatma senaryosu için veri toplamak neredeyse imkansızdır. Mühendisler, veri artırma yöntemini kullanarak yağmur, sis, kar veya parlamayı açık hava görüntülerinde simüle ederler. Bu, algılama sisteminin çevresel faktörlerden bağımsız olarak detect , trafik işaretlerini ve diğer araçları güvenilir bir şekilde detect sağlayarak güvenliği ve güvenilirliği artırır.

Tıbbi Görüntüleme

Tıbbi görüntü analizi, gizlilik endişeleri ve belirli durumların nadirliği nedeniyle genellikle sınırlı veri setlerinden muzdariptir. Artırma, araştırmacıların elastik deformasyonlar, rotasyonlar veya yoğunluk kaymaları uygulayarak küçük X-ray veya MRI tarama veri setlerini genişletmelerine olanak tanır. Bu , hasta pozisyonu veya tarama kalitesi değiştiğinde bile tümörleri veya kırıkları yüksek hassasiyetle tanımlayabilen sağlam teşhis modellerinin eğitilmesine yardımcı olur.

İlgili Kavramları Ayırt Etme

Veri artırımı ile Sentetik Veri arasında ayrım yapmak önemlidir. Her ikisi de veri kümesinin boyutunu artırmayı amaçlasa da, sentetik veri sıfırdan yapay olarak üretilir (genellikle 3D render veya simülasyon motorları kullanılarak), veri artırımı ise mevcut gerçek dünya verilerini değiştirir . Ek olarak, Veri Ön İşleme, verileri bir modele uygun hale getirmek için temizleme ve biçimlendirme (örneğin, yeniden boyutlandırma, normalleştirme) içerir, ancak artırmadan farklı olarak, eğitim örneklerinin sayısını artırması gerekmez.

Ultralytics ile Augmentation'ı Uygulama

Modern çerçeveler, artırmayı doğrudan eğitim sürecine entegre eder. Aşağıdaki örnek, YOLO26 modelinin eğitimi sırasında dönüştürme ve ölçeklendirme gibi artırmaların nasıl uygulanacağını gösterir. ultralytics Paket.

from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Train with custom data augmentation hyperparameters
# fliplr: 50% chance of horizontal flip, scale: image scaling gain
results = model.train(data="coco8.yaml", epochs=10, fliplr=0.5, scale=0.5)

Bu hiperparametreleri ayarlayarak, geliştiriciler artırma stratejisini veri kümelerinin ve uygulamalarının özel ihtiyaçlarına göre uyarlayabilirler. Ultralytics esnekliğinden yararlanarak verimli model geliştirme gerçekleştirebilirler.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın