Sözlük

Veri Büyütme

Makine öğrenimi modellerinizi veri artırımı ile geliştirin. Doğruluğu artıracak, aşırı uyumu azaltacak ve sağlamlığı geliştirecek teknikleri keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Veri büyütme, makine öğreniminde mevcut verilerin değiştirilmiş versiyonlarını oluşturarak bir eğitim veri kümesinin boyutunu yapay olarak genişletmek için kullanılan bir tekniktir. Bu süreç, orijinal verilere döndürme, çevirme, ölçekleme veya görüntüleri kırpma gibi çeşitli dönüşümlerin uygulanmasını içerir. Eğitim verilerinin çeşitliliğini artırarak veri büyütme, makine öğrenimi modellerinin genelleme yeteneğini geliştirmeye yardımcı olur, onları daha sağlam ve aşırı uyuma daha az eğilimli hale getirir. Aşırı uyum, bir modelin gürültü ve aykırı değerler de dahil olmak üzere eğitim verilerini çok iyi öğrenmesi durumunda ortaya çıkar ve bu da yeni, görülmeyen veriler üzerinde düşük performansa yol açabilir.

Veri Artırmanın Faydaları

Veri artırımı birkaç önemli fayda sunar. İlk olarak, modeli eğitim sırasında daha geniş bir varyasyon yelpazesine maruz bırakarak aşırı uyumu azaltmaya yardımcı olur. Bu, modeli eğitim verilerinin belirli özelliklerine daha az duyarlı hale getirir ve yeni, görülmemiş verilere daha fazla genelleme yapabilmesini sağlar. İkinci olarak, özellikle orijinal veri kümesi küçük olduğunda veya çeşitlilikten yoksun olduğunda modellerin doğruluğunu ve performansını artırabilir. Veri artırımı, daha fazla eğitim örneği oluşturarak modele verilerin altında yatan örüntüleri öğrenmesi için daha fazla fırsat sağlar. Son olarak, bir modelin sağlamlığını artırarak onu ışıklandırma, yönlendirme veya arka plan gürültüsündeki değişiklikler gibi girdi verilerindeki değişikliklere karşı daha dirençli hale getirebilir.

Yaygın Veri Artırma Teknikleri

Özellikle bilgisayarla görme görevlerinde veri artırımı için çeşitli yaygın teknikler kullanılmaktadır:

  • Geometrik Dönüşümler: Bunlar döndürme, öteleme, ölçekleme, kesme ve çevirme gibi işlemleri içerir. Örneğin, bir görüntüyü birkaç derece döndürmek veya yatay olarak çevirmek yeni, geçerli eğitim örnekleri oluşturabilir.
  • Renk Uzayı Dönüşümleri: Bir görüntünün parlaklığını, kontrastını, doygunluğunu veya tonunu ayarlamak, farklı aydınlatma koşullarını simüle edebilir ve modelin çeşitli ortamlar arasında genelleme yeteneğini geliştirebilir.
  • Çekirdek Filtreleri: Görüntüleri keskinleştirmek veya bulanıklaştırmak için filtreler uygulamak, modelin bu değişikliklere karşı değişmeyen özellikleri öğrenmesine yardımcı olabilir.
  • Rastgele Silme: Bir görüntünün bazı kısımlarını rastgele maskelemek, modelin oklüzyonlara veya nesnelerin eksik kısımlarına karşı daha sağlam olmasına yardımcı olabilir.
  • Görüntüleri Karıştırma: MixUp ve CutMix gibi teknikler, yeni eğitim örnekleri oluşturmak için görüntüleri ve bunlara karşılık gelen etiketleri karıştırmayı içerir. Örneğin, MixUp hem görüntüleri hem de etiketlerini doğrusal olarak enterpole eder.

Bilgisayarlı Görüde Veri Artırma

Bilgisayarla görmede veri artırımı özellikle kullanışlıdır çünkü bir modelin karşılaşabileceği çok çeşitli gerçek dünya senaryolarını simüle edebilir. Örneğin, nesne algılamada, bir Ultralytics YOLO YOLO sayfasından ilk kez bahsedildiğinde, artırılmış görüntüler üzerinde eğitilen model, nesneleri yönleri, boyutları veya aydınlatma koşullarından bağımsız olarak algılamayı öğrenebilir. Bu, modelin farklı ve öngörülemeyen koşullar altında güvenilir bir şekilde performans göstermesi gereken otonom araçlar gibi uygulamalar için çok önemlidir. Örneğin, yayaların ve araçların görüntülerine döndürme, ölçekleme ve gürültü ekleme gibi çeşitli dönüşümler uygulayarak, otonom bir sürüş sistemi bu nesneleri çeşitli gerçek dünya senaryolarında doğru bir şekilde tespit etmek için eğitilebilir. Benzer şekilde, görüntü sınıflandırmada, görüntülerin farklı renk ayarlamalarıyla zenginleştirilmesi, modelin farklı aydınlatma koşullarına daha iyi genelleme yapmasına yardımcı olabilir.

Diğer Alanlarda Veri Artırımı

Veri artırımı bilgisayarla görmede yaygın olarak kullanılmakla birlikte, doğal dil işleme (NLP) ve ses işleme gibi diğer alanlarda da uygulanabilir. NLP'de eşanlamlı değiştirme, geri çeviri ve kelimelerin rastgele eklenmesi/silinmesi gibi teknikler metin verilerini artırabilir. Ses işlemede, arka plan gürültüsü eklemek, ses perdesini değiştirmek veya sesin zamanını uzatmak farklı eğitim örnekleri oluşturabilir.

Gerçek Dünya Uygulamaları

  • Sağlık hizmetleri: Tıbbi görüntü analizinde veri artırımı, modelleri sınırlı sayıda tıbbi görüntü üzerinde eğitmek için kullanılabilir. Örneğin, MRI taramalarına döndürmeler, çevirmeler ve küçük deformasyonlar uygulayarak, bir model farklı hastalar ve görüntüleme koşullarında anomalileri daha doğru bir şekilde tespit etmeyi öğrenebilir.
  • Tarım: Veri artırımı, çeşitli koşullar altında çekilen görüntülerden bitki hastalıklarını veya zararlılarını tespit etmek için modellerin eğitilmesine yardımcı olabilir. Farklı aydınlatma, açılar ve yakınlaştırma seviyelerine sahip mahsul görüntülerini artırarak, modeller sahada güçlü bir performans sergileyebilir ve çiftçilerin sorunları erken tespit edip düzeltici önlemler almasına yardımcı olabilir.

Veri Artırma ve Diğer Teknikler

Veri artırımını diğer ilgili tekniklerden ayırmak önemlidir:

  • Veri Ön İşleme: Hem veri artırma hem de veri ön işleme verileri model eğitimi için hazırlarken, ön işleme tipik olarak normalleştirme, standardizasyon ve eksik değerlerin ele alınması gibi adımları içerir. Bu adımlar, verilerin model için uygun bir formatta olmasını sağlamak için gereklidir. Öte yandan veri artırma, eğitim verilerinin çeşitliliğini artırmaya odaklanır.
  • Sentetik Veri Üretimi: Sentetik veri, genellikle Generative Adversarial Networks (GANs) gibi üretken modeller kullanarak tamamen yeni veri noktaları oluşturmayı içerir. Bu, mevcut verileri değiştiren veri artırımından farklıdır. Sentetik veriler, tıbbi veya finansal uygulamalarda olduğu gibi gerçek verilerin az veya hassas olduğu durumlarda özellikle yararlı olabilir.

Araçlar ve Kütüphaneler

Çeşitli araçlar ve kütüphaneler veri artırımını destekler. Python adresinde OpenCV ve TensorFlow görüntü dönüşümleri için geniş bir fonksiyon yelpazesi sunar. Ek olarak, Albumentations gibi özel kütüphaneler son derece optimize edilmiş ve çeşitli büyütme boru hatları sunar. Ultralytics HUB ayrıca veri büyütme için araçlar sağlayarak bu tekniklerin model eğitim sürecine entegre edilmesini kolaylaştırır. Model eğitimini geliştirmek için MixUp, Mosaic ve Random Perspective gibi veri artırma tekniklerini keşfedin.

Tümünü okuyun