Sözlük

Veri Büyütme

Makine öğrenimi modellerinizi veri artırımı ile geliştirin. Doğruluğu artıracak, aşırı uyumu azaltacak ve sağlamlığı geliştirecek teknikleri keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Veri artırımı, makine öğreniminde (ML) mevcut veri noktalarının değiştirilmiş kopyalarını oluşturarak veya bunlardan yeni sentetik veriler üreterek bir eğitim veri kümesinin boyutunu ve çeşitliliğini yapay olarak artırmak için kullanılan bir tekniktir. Bu süreç, özellikle çok miktarda çeşitli veri toplamanın zor ve pahalı olabileceği bilgisayarla görme gibi alanlarda makine öğrenimi modellerinin performansını, genellemesini ve sağlamlığını artırmaya yardımcı olur. gibi modelleri açığa çıkararak Ultralytics YOLO Eğitim sırasında daha geniş bir varyasyon yelpazesine maruz kalmaları için veri artırımı, görülmeyen gerçek dünya verilerinde daha iyi performans göstermelerine yardımcı olur.

Veri Artırma Nasıl Çalışır?

Veri büyütme, yeni, makul örnekler oluşturmak için orijinal veri noktalarına çeşitli dönüşümler uygular. Görüntü verileri için yaygın teknikler şunları içerir:

  • Geometrik Dönüşümler: Görüntüleri döndürme, ölçekleme, öteleme (kaydırma), çevirme (yatay veya dikey) ve kesme.
  • Renk Uzayı Dönüşümleri: Parlaklığı, kontrastı, doygunluğu, tonu ayarlama veya renk titreşimi uygulama.
  • Gürültü Enjeksiyonu: Sensör kusurlarını veya düşük ışık koşullarını simüle etmek için rastgele gürültü (örn. Gauss gürültüsü) ekleme.
  • Rastgele Silme/Kesme: Modeli bir nesnenin farklı kısımlarına odaklanmaya teşvik etmek için bir görüntüden rastgele yamaları kaldırmak.
  • Görüntüleri Karıştırma: Kompozit eğitim örnekleri oluşturmak için Mozaik büyütme ( YOLOv4 gibi modellerde kullanılır) veya MixUp gibi birden fazla görüntünün birleştirilmesi.

En çok bilgisayarla görme alanında öne çıksa da, Doğal Dil İşleme'de (NLP) metin verileri için eşanlamlı değiştirme veya geri çeviri gibi diğer veri türleri için de artırma teknikleri mevcuttur.

Önemi ve Faydaları

Veri artırımı, makine öğrenimi modeli geliştirmede birkaç önemli avantaj sunar:

  • Veri Kıtlığı Sorunlarını Azaltır: Sınırlı veri kümelerini genişleterek, büyük miktarda orijinal verinin mevcut olmadığı durumlarda bile derin sinir ağları gibi karmaşık modellerin eğitilmesini mümkün kılar.
  • Aşırı Uyumu Önler: Varyasyonlar sunarak artırma, modellerin yalnızca eğitim verilerini ezberlemesini(aşırı uyum) önlemeye yardımcı olur ve onları daha genelleştirilebilir özellikler öğrenmeye teşvik eder. Daha fazla strateji için model eğitimi ipuçlarımızı okuyun.
  • Model Sağlamlığını Geliştirir: Artırılmış veriler üzerinde eğitim, modelleri aydınlatma, yönlendirme veya ölçek değişiklikleri gibi girdi değişikliklerine karşı daha az hassas hale getirerek çeşitli gerçek dünya koşullarında daha iyi performans sağlar.
  • Maliyet ve Zaman Verimliliği: Mevcut verileri artırmak, yeni veri toplamak ve etiketlemekten genellikle daha ucuz ve daha hızlıdır.

Teknikler ve Araçlar

Çeşitli kütüphaneler veri artırma tekniklerinin uygulanmasını basitleştirir. Bilgisayarla görme görevleri için popüler araçlar şunlardır:

Ultralytics modelleri çeşitli yerleşik artırma teknikleri içerir ve kullanıcılar Ultralytics HUB gibi platformları kullanarak veri kümelerini ve modelleri yönetebilir.

Gerçek Dünya Uygulamaları

Veri artırımı çeşitli alanlarda yaygın olarak kullanılmaktadır:

  1. Tıbbi Görüntüleme: Sağlık hizmetlerinde, tıbbi görüntülerin (röntgen veya BT taramaları gibi) büyük, çeşitli veri kümelerini elde etmek, gizlilik düzenlemeleri ve belirli koşulların nadirliği nedeniyle zor olabilir. Veri artırımı (örn. döndürme, yakınlaştırma, kontrastı ayarlama), tümör tespiti veya hastalık sınıflandırması gibi görevler için sağlam modellerin eğitilmesine yardımcı olarak teşhis doğruluğunu artırır. Bu, Sağlık Hizmetlerinde Yapay Zekayı ilerletmenin önemli bir parçasıdır.
  2. Otonom Araçlar: Sürücüsüz araçlar, çevrelerini algılamak için büyük ölçüde nesne algıl amaya güvenir. Farklı hava koşullarını (yağmur, sis), aydınlatmayı (gündüz, gece) simüle ederek, oklüzyonlar ekleyerek veya nesne perspektiflerini değiştirerek eğitim görüntülerini artırmak, aracın algılama sisteminin çeşitli sürüş senaryolarında güvenilir bir şekilde çalışmasını sağlamaya yardımcı olur. Bu, Otomotiv uygulamaları için Yapay Zeka 'da güvenliği artırır.

Veri Artırımı ve Sentetik Veri

Birbiriyle ilişkili olsa da veri büyütme, sentetik veri üretiminden farklıdır. Veri artırımı tipik olarak, biraz değiştirilmiş versiyonlar oluşturmak için mevcut gerçek veri noktalarına dönüşümler uygulamayı içerir. Buna karşılık sentetik veri, gerçek bir veri noktasından başlamak zorunda olmadan, genellikle simülasyonlar, algoritmalar veya GAN'lar gibi üretken modeller kullanılarak yapay olarak oluşturulan tamamen yeni verileri ifade eder. Her iki teknik de veri kümelerini geliştirmeyi amaçlar, ancak sentetik veriler potansiyel olarak orijinal verilerde hiç bulunmayan senaryolar oluşturabilirken, artırma öncelikle mevcut verilerdeki varyansı artırır.

Tümünü okuyun