Sözlük

Veri Büyütme

Veri artırma ile model doğruluğunu artırın! Veri kümelerini genişletme, aşırı uyumu önleme ve bilgisayarla görme performansını artırma tekniklerini öğrenin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Veri artırımı, mevcut verilerin değiştirilmiş versiyonlarını oluşturarak bir eğitim veri kümesinin boyutunu yapay olarak artırmak için makine öğreniminde kullanılan bir tekniktir. Bu teknik, özellikle orijinal veri kümesi sınırlı olduğunda, makine öğrenimi modellerinin performansını ve genelleme yeteneğini geliştirmeye yardımcı olur. Veri artırımı, modeli daha çeşitli veri noktalarına maruz bırakarak, bir modelin eğitim verilerine çok fazla uzmanlaştığı ve görünmeyen veriler üzerinde düşük performans gösterdiği aşırı uyumu önlemeye yardımcı olur.

Veri Artırmanın Uygunluğu ve Önemi

Veri artırımı, büyük veri kümelerinin toplanması ve etiketlenmesinin pahalı ve zaman alıcı olabildiği bilgisayarla görme görevlerinde özellikle değerlidir. Örneğin, nesne algılamada, sınırlı bir veri kümesi üzerinde eğitilen bir model farklı ışık koşulları, yönler veya ölçekler altında nesneleri tanımakta zorlanabilir. Döndürmeler, çevirmeler, kırpmalar ve renk ayarlamaları gibi güçlendirmeler uygulayarak, model daha geniş bir senaryo yelpazesine maruz kalır ve gerçek dünya uygulamalarında daha sağlam ve doğru hale gelir. Veri artırımı, veri kümesindeki belirli sınıfların diğerlerinden önemli ölçüde daha az örneğe sahip olduğu sınıf dengesizliği sorunlarını ele almak için de kullanılabilir. Model, yeterince temsil edilmeyen sınıflardan gelen verileri seçici olarak artırarak verilerin daha dengeli bir temsilini öğrenebilir. Bilgisayarla görme projeleri için veri toplama ve açıklama ekleme hakkında daha fazla bilgi edinin.

Yaygın Veri Artırma Teknikleri

Bilgisayarla görmede veri artırımı için yaygın olarak çeşitli teknikler kullanılmaktadır:

  • Geometrik Dönüşümler: Bunlar, görüntülerin uzamsal özelliklerinin değiştirilmesini içerir, örneğin:
    • Döndürme: Bir görüntüyü belirli bir açıyla döndürme.
    • Çevirme: Bir görüntüyü yatay veya dikey olarak çevirme.
    • Ölçekleme: Bir görüntüyü büyütme veya küçültme.
    • Kırpma: Bir görüntünün bir kısmının çıkarılması.
    • Çeviri: Bir görüntüyü yatay veya dikey olarak kaydırma.
  • Renk Uzayı Dönüşümleri: Bunlar, görüntülerin renk özelliklerini değiştirmeyi içerir, örneğin:
    • Parlaklık Ayarı: Bir görüntünün genel parlaklığını artırma veya azaltma.
    • Kontrast Ayarı: Bir görüntünün en koyu ve en açık kısımları arasındaki farkı artırma veya azaltma.
    • Doygunluk Ayarı: Bir görüntüdeki renklerin yoğunluğunu artırma veya azaltma.
    • Ton Ayarlama: Bir görüntüdeki renkleri renk spektrumu boyunca kaydırma.
  • Gürültü Enjeksiyonu: Bir görüntüye rastgele gürültü eklenmesi, modelin görüntü kalitesindeki değişikliklere karşı daha dirençli olmasına yardımcı olabilir.
  • Çekirdek Filtreleri: Farklı görüntü yakalama koşullarını simüle etmek için bir görüntüye bulanıklaştırma veya keskinleştirme gibi filtreler uygulama.

Gerçek Dünya Uygulamalarında Veri Artırma

Veri artırımı, çeşitli gerçek dünya AI/ML uygulamalarında yaygın olarak kullanılmaktadır. İşte iki somut örnek:

  1. Tıbbi Görüntü Analizi: Tıbbi görüntülemede, büyük etiketli veri kümeleri elde etmek, gizlilik endişeleri ve uzman açıklamalarına duyulan ihtiyaç nedeniyle zor olabilir. Veri artırma teknikleri, tıbbi görüntü veri kümelerinin boyutunu ve çeşitliliğini artırmak için kullanılır ve tümör tespiti, lezyon segmentasyonu ve hastalık sınıflandırması gibi görevler için modellerin performansını artırır. Örneğin, bir beyin tümörü tespit veri kümesinde, mevcut MRI veya CT taramalarına rotasyonlar, çevirmeler ve küçük ötelemeler uygulamak, modelin beyin içindeki yönelimleri veya konumlarından bağımsız olarak tümörleri tanımlamayı öğrenmesine yardımcı olabilir. Daha fazla bilgi için sağlık hizmetlerinde yapay zekayı keşfedin.
  2. Otonom Sürüş: Kendi kendine giden otomobiller, yayaları, araçları ve trafik işaretlerini tespit etmek de dahil olmak üzere çevrelerini algılamak için büyük ölçüde bilgisayarla görme modellerine güvenir. Veri artırımı, bu modellerin çeşitli gerçek dünya koşullarına karşı dayanıklı olacak şekilde eğitilmesinde önemli bir rol oynamaktadır. Örneğin, eğitim görüntülerini farklı aydınlatma koşulları, hava koşulları (örn. yağmur, kar, sis) ve oklüzyonlarla zenginleştirerek, modeller zorlu senaryolar altında nesneleri doğru bir şekilde tespit etmeyi öğrenebilir ve otonom sürüş sistemlerinin güvenliğini ve güvenilirliğini artırabilir. Sürücüsüz araçlarda yapay zeka hakkında daha fazla bilgi edinin.

Veri Artırma ve İlgili Kavramlar

Veri artırımı, makine öğrenimindeki diğer önemli kavramlarla yakından ilişkilidir:

  • Aşırı uyum: Veri artırımı, bir modelin eğitim verilerinde iyi performans gösterdiği ancak görünmeyen verilerde kötü performans gösterdiği aşırı uyumu azaltmak için güçlü bir tekniktir. Eğitim setinin çeşitliliğini artırarak, büyütme modelin yeni, görülmemiş örneklere daha iyi genelleme yapmasına yardımcı olur. Bu durum, bir modelin verilerdeki altta yatan örüntüleri yakalamak için çok basit olduğu yetersiz uyum ile tezat oluşturur.
  • Düzenlileştirme: Veri artırımı, modelin aşırı karmaşık hale gelmesini ve eğitim verilerine çok yakından uymasını önleyen kısıtlamalar getirdiği için bir tür düzenlileştirme olarak görülebilir. Diğer düzenlileştirme teknikleri arasında, ağırlıklarının büyüklüğüne bağlı olarak modelin kayıp fonksiyonuna cezalar ekleyen L1 ve L2 düzenlileştirme yer alır.
  • Transfer Öğrenimi: Veri artırımı, büyük bir veri kümesi (örneğin ImageNet) üzerinde önceden eğitilmiş bir modelin daha küçük, göreve özgü bir veri kümesi üzerinde ince ayarının yapıldığı transfer öğrenimi ile birleştirildiğinde özellikle etkili olabilir. Daha küçük veri kümesinin genişletilmesi, modelin yeni göreve daha iyi uyum sağlamasına yardımcı olabilir ve sınırlı veriye aşırı uyumu önleyebilir. Açıklamalı verileri ön işleme hakkında daha fazla bilgi edinin.

Özetle, veri artırımı, özellikle bilgisayarla görme alanında makine öğrenimi modellerinin performansını ve sağlamlığını artırmak için çok önemli bir tekniktir. Veri artırımı, eğitim veri setini mevcut verilerin değiştirilmiş versiyonlarıyla yapay olarak genişleterek modellerin görülmeyen verilere daha iyi genelleme yapmasına yardımcı olur, aşırı uyumu önler ve sınıf dengesizliği gibi sorunları giderir. Ultralytics YOLO modelleri, çeşitli bilgisayarla görme görevlerinde performanslarını artırmak için veri artırımından yararlanır. Albumentations 'ın Ultralytics ile entegrasyonu, veri kümelerinize çok çeşitli güçlendirmeler uygulamak için güçlü ve esnek bir yol sağlar. Ultralytics 'un diğer araçlar ve platformlarla nasıl çalıştığı hakkında daha fazla bilgi edinmek için entegrasyonlar sayfamızı keşfedin.

Tümünü okuyun