Makine öğrenimi modellerinizi veri artırımı ile geliştirin. Doğruluğu artıracak, aşırı uyumu azaltacak ve sağlamlığı geliştirecek teknikleri keşfedin.
Veri büyütme, makine öğreniminde mevcut verilerin değiştirilmiş versiyonlarını oluşturarak bir eğitim veri kümesinin boyutunu yapay olarak genişletmek için kullanılan bir tekniktir. Bu süreç, orijinal verilere döndürme, çevirme, ölçekleme veya görüntüleri kırpma gibi çeşitli dönüşümlerin uygulanmasını içerir. Eğitim verilerinin çeşitliliğini artırarak veri büyütme, makine öğrenimi modellerinin genelleme yeteneğini geliştirmeye yardımcı olur, onları daha sağlam ve aşırı uyuma daha az eğilimli hale getirir. Aşırı uyum, bir modelin gürültü ve aykırı değerler de dahil olmak üzere eğitim verilerini çok iyi öğrenmesi durumunda ortaya çıkar ve bu da yeni, görülmeyen veriler üzerinde düşük performansa yol açabilir.
Veri artırımı birkaç önemli fayda sunar. İlk olarak, modeli eğitim sırasında daha geniş bir varyasyon yelpazesine maruz bırakarak aşırı uyumu azaltmaya yardımcı olur. Bu, modeli eğitim verilerinin belirli özelliklerine daha az duyarlı hale getirir ve yeni, görülmemiş verilere daha fazla genelleme yapabilmesini sağlar. İkinci olarak, özellikle orijinal veri kümesi küçük olduğunda veya çeşitlilikten yoksun olduğunda modellerin doğruluğunu ve performansını artırabilir. Veri artırımı, daha fazla eğitim örneği oluşturarak modele verilerin altında yatan örüntüleri öğrenmesi için daha fazla fırsat sağlar. Son olarak, bir modelin sağlamlığını artırarak onu ışıklandırma, yönlendirme veya arka plan gürültüsündeki değişiklikler gibi girdi verilerindeki değişikliklere karşı daha dirençli hale getirebilir.
Özellikle bilgisayarla görme görevlerinde veri artırımı için çeşitli yaygın teknikler kullanılmaktadır:
Bilgisayarla görmede veri artırımı özellikle kullanışlıdır çünkü bir modelin karşılaşabileceği çok çeşitli gerçek dünya senaryolarını simüle edebilir. Örneğin, nesne algılamada, bir Ultralytics YOLO YOLO sayfasından ilk kez bahsedildiğinde, artırılmış görüntüler üzerinde eğitilen model, nesneleri yönleri, boyutları veya aydınlatma koşullarından bağımsız olarak algılamayı öğrenebilir. Bu, modelin farklı ve öngörülemeyen koşullar altında güvenilir bir şekilde performans göstermesi gereken otonom araçlar gibi uygulamalar için çok önemlidir. Örneğin, yayaların ve araçların görüntülerine döndürme, ölçekleme ve gürültü ekleme gibi çeşitli dönüşümler uygulayarak, otonom bir sürüş sistemi bu nesneleri çeşitli gerçek dünya senaryolarında doğru bir şekilde tespit etmek için eğitilebilir. Benzer şekilde, görüntü sınıflandırmada, görüntülerin farklı renk ayarlamalarıyla zenginleştirilmesi, modelin farklı aydınlatma koşullarına daha iyi genelleme yapmasına yardımcı olabilir.
Veri artırımı bilgisayarla görmede yaygın olarak kullanılmakla birlikte, doğal dil işleme (NLP) ve ses işleme gibi diğer alanlarda da uygulanabilir. NLP'de eşanlamlı değiştirme, geri çeviri ve kelimelerin rastgele eklenmesi/silinmesi gibi teknikler metin verilerini artırabilir. Ses işlemede, arka plan gürültüsü eklemek, ses perdesini değiştirmek veya sesin zamanını uzatmak farklı eğitim örnekleri oluşturabilir.
Veri artırımını diğer ilgili tekniklerden ayırmak önemlidir:
Çeşitli araçlar ve kütüphaneler veri artırımını destekler. Python adresinde OpenCV ve TensorFlow görüntü dönüşümleri için geniş bir fonksiyon yelpazesi sunar. Ek olarak, Albumentations gibi özel kütüphaneler son derece optimize edilmiş ve çeşitli büyütme boru hatları sunar. Ultralytics HUB ayrıca veri büyütme için araçlar sağlayarak bu tekniklerin model eğitim sürecine entegre edilmesini kolaylaştırır. Model eğitimini geliştirmek için MixUp, Mosaic ve Random Perspective gibi veri artırma tekniklerini keşfedin.