Veri Artırımı: 2025 için Nihai Kılavuz

Yapay zeka patlaması nedeniyle, fabrikalarda çalışan robotlar ve sokaklarda gezinen sürücüsüz arabalar gibi olaylar daha sık manşetlere çıkıyor. Yapay zeka, tıbbi görüntülemeyi iyileştirmekten üretim hatlarında kalite kontrolüne yardımcı olmaya kadar makinelerin dünyayla etkileşim biçimini değiştiriyor.

Bu ilerlemenin büyük bir kısmı, makinelerin görüntüleri anlamasını ve yorumlamasını mümkün kılan bir yapay zeka dalı olan bilgisayarla görmeden geliyor. Tıpkı insanların zaman içinde nesneleri ve desenleri tanımayı öğrenmesi gibi, Vision AI modelleri de Ultralytics YOLO11 görsel anlayışlarını geliştirmek için büyük miktarda görüntü verisi üzerinde eğitilmeleri gerekir.

Ancak, bu kadar büyük miktarda görsel veri toplamak her zaman kolay değildir. Bilgisayarlı görü topluluğu birçok büyük veri kümesi oluşturmuş olsa da, yine de düşük ışıkta nesnelerin bulunduğu, kısmen gizlenmiş öğelerin veya farklı açılardan görüntülenen şeylerin bulunduğu görüntüler gibi belirli varyasyonları kaçırabilirler. Bu farklılıklar, yalnızca belirli koşullarda eğitilmiş bilgisayarlı görü modelleri için kafa karıştırıcı olabilir.

Görüntü veri artırma, mevcut verilere yeni varyasyonlar ekleyerek bu sorunu çözen bir tekniktir. Renkleri ayarlamak, döndürmek veya perspektifi değiştirmek gibi görüntülerde değişiklikler yaparak, veri kümesi daha çeşitli hale gelir ve Vision AI modellerinin gerçek dünya durumlarında nesneleri daha iyi tanımasına yardımcı olur.

Bu makalede, görüntü veri artırmanın nasıl çalıştığını ve bilgisayarlı görü uygulamaları üzerindeki etkisini inceleyeceğiz.

Görüntü veri artırma nedir?

Diyelim ki kalabalıkta bir arkadaşınızı tanımaya çalışıyorsunuz, ancak güneş gözlüğü takıyor veya gölgeli bir yerde duruyor. Görünüşündeki bu küçük değişikliklere rağmen, hala kim olduğunu biliyorsunuz. Öte yandan, bir Yapay Görme modeli, farklı ortamlarda nesneleri tanımak üzere eğitilmediği sürece bu tür değişikliklerle başa çıkmakta zorlanabilir.

Görüntü veri artırma, binlerce yeni görüntü toplamak yerine, mevcut görüntülerin değiştirilmiş versiyonlarını eğitim verilerine ekleyerek bilgisayar görüşü modeli performansını artırır.

Görüntüleri çevirme, döndürme, parlaklığı ayarlama veya küçük bozulmalar ekleme gibi değişiklikler, Yapay Görme modellerini daha geniş bir koşul yelpazesine maruz bırakır. Modeller, büyük veri kümelerine güvenmek yerine, artırılmış görüntülerle daha küçük eğitim veri kümelerinden verimli bir şekilde öğrenebilir.

__wf_reserved_inherit — Şekil 1. Bir arabanın artırılmış görüntülerine örnekler.

‍

Bilgisayar görüşünde veri artırmanın önemi

İşte artırmanın bilgisayar görüşü için neden bu kadar önemli olduğuna dair bazı temel nedenler:

Veri gereksinimlerini azaltır: Büyük görüntü veri kümeleri toplamak zaman ve kaynak gerektirir. Artırma, büyük veri kümelerine ihtiyaç duymadan modelleri etkili bir şekilde eğitmek için kullanılabilir.
‍
Aşırı öğrenmeyi önler: Çok az örnek üzerinde eğitilmiş bir model, genel kalıpları tanımak yerine ayrıntıları ezberleyebilir. Artırma yoluyla çeşitlilik eklemek, Yapay Görme modellerinin yeni ve görülmemiş verilere uygulanacak şekilde öğrenmesini sağlar.
‍
Kusurlu görüntüleri taklit eder: Veri kümelerindeki görüntüler genellikle çok mükemmeldir, ancak gerçek dünyadaki fotoğraflar bulanık, gizlenmiş veya bozulmuş olabilir. Görüntüleri gürültü, tıkanıklıklar veya diğer varyasyonlarla artırmak, onları daha gerçekçi hale getirir.
‍
Modelin sağlamlığını artırır: Çeşitli görüntülerle eğitim, yapay zekanın gerçek dünyadaki değişikliklerle başa çıkmasına yardımcı olarak farklı ortamlarda, aydınlatma koşullarında ve durumlarda daha güvenilir hale getirir.

Görüntü veri artırmayı ne zaman kullanmalısınız?

Görüntü veri artırma, özellikle bir bilgisayar görüşü modelinin farklı durumlarda nesneleri tanıması gerektiğinde, ancak yeterince çeşitli görüntüye sahip olmadığında faydalıdır.

Örneğin, araştırmacılar nadiren fotoğraflanan nadir su altı türlerini tanımlamak için bir Vision AI modelini eğitiyorlarsa, veri kümesi küçük olabilir veya çeşitlilikten yoksun olabilir. Görüntüleri zenginleştirerek - farklı su derinliklerini simüle etmek için renkleri ayarlayarak, bulanık koşulları taklit etmek için gürültü ekleyerek veya doğal hareketi hesaba katmak için şekilleri biraz değiştirerek - model su altındaki nesneleri daha doğru bir şekilde detect etmeyi öğrenebilir.

İşte artırmanın büyük bir fark yarattığı diğer bazı durumlar:

Veri setini dengeleme: Bazı nesneler eğitim verilerinde daha az görünebilir ve bu da Görüntüleme Yapay Zeka modellerini önyargılı hale getirebilir. Artırma, nadir nesnelerin daha fazla örneğini oluşturmaya yardımcı olur, böylece model tüm kategorileri adil bir şekilde tanıyabilir.
‍
Farklı kameralara uyum sağlama: Görüntüler cihaza bağlı olarak farklı görünebilir. Artırma, Görüntüleme Yapay Zeka modellerinin farklı çözünürlük, aydınlatma ve kalitedeki fotoğraflarda iyi performans göstermesine yardımcı olur.
‍
Küçük etiketleme hatalarını düzeltme: Hafif kaymalar, kırpmalar veya döndürmeler, bilgisayarlı görü modellerinin nesneleri doğru bir şekilde tanımasına yardımcı olur, orijinal etiketler mükemmel şekilde hizalanmamış olsa bile.

Görüntü veri artırma nasıl çalışır?

Bilgisayarlı görünün ilk günlerinde, görüntü veri artırma öncelikle veri seti çeşitliliğini artırmak için çevirme, döndürme ve kırpma gibi temel görüntü işleme tekniklerini içeriyordu. Yapay zeka geliştikçe, öğrenmeyi geliştirmek için renkleri ayarlama (renk uzayı dönüşümleri), görüntüleri keskinleştirme veya bulanıklaştırma (çekirdek filtreleri) ve birden çok görüntüyü bir araya getirme (görüntü karıştırma) gibi daha gelişmiş yöntemler tanıtıldı.

Artırma, model eğitimi öncesinde ve sırasında gerçekleşebilir. Eğitimden önce, daha fazla çeşitlilik sağlamak için değiştirilmiş görüntüler veri setine eklenebilir. Eğitim sırasında, görüntüler gerçek zamanlı olarak rastgele değiştirilebilir ve bu da Görüntüleme Yapay Zeka modellerinin farklı koşullara uyum sağlamasına yardımcı olur.

Bu değişiklikler matematiksel dönüşümler kullanılarak yapılır. Örneğin, döndürme bir görüntüyü yatırır, kırpma farklı görünümleri taklit etmek için parçaları kaldırır ve parlaklık değişiklikleri aydınlatma varyasyonlarını simüle eder. Bulanıklaştırma görüntüleri yumuşatır, keskinleştirme ayrıntıları daha net hale getirir ve görüntü karıştırma farklı görüntülerin parçalarını birleştirir. OpenCV, TensorFlow ve PyTorch gibi görsel yapay zeka çerçeveleri ve araçları bu işlemleri otomatikleştirerek büyütmeyi hızlı ve etkili hale getirebilir.

Temel görüntü veri artırma teknikleri

Görüntü veri artırmanın ne olduğunu tartıştığımıza göre, eğitim verilerini geliştirmek için kullanılan bazı temel görüntü veri artırma tekniklerine daha yakından bakalım.

Yönlendirme ve konumu ayarlama

YOLO11 gibi bilgisayarla görme modellerinin genellikle nesneleri çeşitli açılardan ve bakış açılarından tanıması gerekir. Bu konuda yardımcı olmak için görüntüler yatay veya dikey olarak çevrilebilir, böylece yapay zeka modeli nesneleri farklı bakış açılarından tanımayı öğrenir.

Benzer şekilde, görüntüleri hafifçe döndürmek, açısını değiştirerek modelin nesneleri birden çok perspektiften tanımlamasını sağlar. Ayrıca, görüntüleri farklı yönlerde kaydırmak (öteleme), modellerin küçük konumsal değişikliklere uyum sağlamasına yardımcı olur. Bu dönüşümler, modellerin bir görüntüdeki nesne yerleşiminin tahmin edilemez olduğu gerçek dünya koşullarına daha iyi genellemesini sağlar.

‍

Yeniden boyutlandırma ve kırpma

Gerçek dünyadaki bilgisayarla görme çözümleri açısından, görüntülerdeki nesneler farklı mesafelerde ve boyutlarda görünebilir. Görme yapay zeka modellerinin bu farklılıklardan bağımsız olarak onları detect edebilecek kadar sağlam olması gerekir.

Uyarlanabilirliği artırmak için aşağıdaki artırma yöntemleri kullanılabilir:

Ölçeklendirme: Yeniden boyutlandırma, oranlarını korurken görüntü boyutunu değiştirir ve yapay zeka modellerinin farklı mesafelerdeki nesneleri detect sağlar.
‍
Kırpma: Bu, bir görüntünün gereksiz kısımlarını kaldırarak modelin temel alanlara odaklanmasına yardımcı olur ve arka plan dikkat dağıtıcı unsurlarını azaltır.
‍
Eğme: Bir görüntüyü hafifçe eğmek, eğimli veya gerilmiş bir görünümü simüle ederek yapay zekanın nesneleri farklı açılardan tanımasına yardımcı olur.

Bu ayarlamalar, bilgisayarla görü modellerinin nesneleri boyutları veya şekilleri hafifçe değişse bile tanımasına yardımcı olur.

Perspektif ve bozulma ayarlamaları

Görüntülerdeki nesneler, kamera açısına bağlı olarak farklı görünebilir ve bu da bilgisayarla görü modelleri için tanımayı zorlaştırır. Modellerin bu varyasyonları işlemesine yardımcı olmak için, artırma teknikleri nesnelerin görüntülerde nasıl sunulduğunu ayarlayabilir.

Örneğin, perspektif dönüşümleri görüş açısını değiştirebilir ve bir nesnenin farklı bir konumdan görülüyormuş gibi görünmesini sağlayabilir. Bu, Görü Yapay Zeka modellerinin nesneleri eğimli olduklarında veya alışılmadık bir bakış açısından yakalandıklarında bile tanımasına olanak tanır.

Başka bir örnek, nesnelerin yansımalarda veya basınç altında görüneceği şekilde doğal bozulmaları simüle etmek için görüntüleri geren, büken veya çarpıtan elastik bir dönüşümdür.

Renk ve aydınlatma değişiklikleri

Aydınlatma koşulları ve renk farklılıkları, Görü Yapay Zeka modellerinin görüntüleri nasıl yorumladığını önemli ölçüde etkileyebilir. Nesneler çeşitli aydınlatma ayarlarında farklı görünebileceğinden, aşağıdaki artırma teknikleri bu durumların ele alınmasına yardımcı olabilir:

Parlaklık ve kontrast ayarlamaları: Farklı aydınlatma koşullarını simüle etmek, Görü Yapay Zeka modellerinin nesneleri hem parlak hem de karanlık ortamlarda tanımasına yardımcı olur.
‍
Renk titreşimi: Tonu, doygunluğu ve renk dengesini rastgele değiştirmek, bilgisayarla görü modellerini farklı kameralara ve aydınlatma koşullarına daha uyarlanabilir hale getirir.
‍
Gri tonlamaya dönüştürme: Görüntüleri siyah beyaza dönüştürmek, Görü Yapay Zeka modellerini renk yerine şekillere ve dokulara odaklanmaya teşvik eder.

‍

Gelişmiş görüntü veri artırma teknikleri

Şimdiye kadar, yalnızca tek bir görüntüyü değiştiren artırma tekniklerini inceledik. Ancak, bazı gelişmiş yöntemler yapay zeka öğrenimini geliştirmek için birden çok görüntüyü birleştirmeyi içerir.

Örneğin, MixUp iki görüntüyü birbirine karıştırarak bilgisayarla görme modellerinin nesne ilişkilerini anlamasına yardımcı olur ve farklı senaryolar arasında genelleme yapma yeteneklerini geliştirir. CutMix bunu bir adım daha ileri götürerek bir görüntünün bir bölümünü başka bir görüntünün bir bölümüyle değiştiriyor ve modellerin aynı görüntü içindeki birden fazla bağlamdan öğrenmesini sağlıyor. Bu arada CutOut, bir görüntünün rastgele kısımlarını kaldırarak farklı bir şekilde çalışır ve Vision AI modellerini nesneleri kısmen gizlendiklerinde veya engellendiklerinde bile tanımaları için eğitir.

‍

Üretken yapay zekanın görüntü veri artırmadaki rolü

Üretken yapay zeka birçok sektörde ve günlük uygulamalarda giderek daha fazla ilgi görmektedir. Muhtemelen yapay zeka tarafından oluşturulan görüntüler, deepfake videolar veya gerçekçi avatarlar oluşturan uygulamalarla karşılaşmışsınızdır. Ancak yaratıcılık ve eğlencenin ötesinde, Üretken Yapay Zeka, mevcut görüntülerden yenilerini oluşturarak Vision AI modellerini eğitmede çok önemli bir rol oynar.

Sadece resimleri çevirmek veya döndürmek yerine, gerçekçi varyasyonlar oluşturabilir; yüz ifadelerini, giyim tarzlarını değiştirebilir, hatta farklı hava koşullarını simüle edebilir. Bu varyasyonlar, bilgisayarlı görü modellerinin çeşitli gerçek dünya senaryolarında daha uyarlanabilir ve doğru olmasına yardımcı olur. GAN'lar (Generative Adversarial Networks - Üretken Çekişmeli Ağlar) ve difüzyon modelleri gibi gelişmiş üretken yapay zeka modelleri de eksik ayrıntıları doldurabilir veya yüksek kaliteli sentetik görüntüler oluşturabilir.

Görüntü veri artırmanın sınırlamaları

Veri artırma, eğitim veri kümelerini iyileştirse de, dikkate alınması gereken bazı sınırlamalar da vardır. Görüntü veri artırmayla ilgili bazı temel zorluklar şunlardır:

Sınırlı veri çeşitliliği: Artırılmış görüntüler mevcut verilerden gelir ve tamamen yeni desenler veya nadir perspektifler sunamaz.
‍
Olası veri bozulması: Aşırı dönüşümler görüntüleri gerçek dışı hale getirebilir ve bu da gerçek dünya senaryolarında model doğruluğunu potansiyel olarak azaltabilir.
‍
Artan işlem yükü: Model eğitimi sırasında gerçekleşen gerçek zamanlı artırma, önemli miktarda işlem gücü gerektirebilir, bu da eğitimi yavaşlatır ve bellek kullanımını artırır.
‍
Sınıf dengesizliği devam ediyor: Artırma tamamen yeni örnekler oluşturmaz, bu nedenle yeterince temsil edilmeyen kategoriler hala yanlı öğrenmeye yol açabilir.

Görüntü veri artırmanın gerçek dünya uygulaması

Görüntü verilerinin artırılmasının ilginç bir uygulaması, YOLO11 gibi bilgisayarla görme modelleri tarafından verilen anlık kararların çok önemli olduğu sürücüsüz araçlardır. Modelin yolları, insanları ve diğer nesneleri doğru bir şekilde detect edebilmesi gerekir.

Ancak, otonom sürüşlü bir aracın karşılaştığı gerçek dünya koşulları tahmin edilemez olabilir. Kötü hava koşulları, hareket bulanıklığı ve gizli işaretler, bu sektördeki Vision AI çözümlerini karmaşık hale getirebilir. Bilgisayarlı görü modellerini yalnızca gerçek dünya görüntüleriyle eğitmek genellikle yeterli değildir. Otonom sürüşlü arabalardaki modeller için görüntü veri kümelerinin çeşitli olması gerekir, böylece model beklenmedik durumlarla başa çıkmayı öğrenebilir.

Görüntü veri artırma, sisi simüle ederek, parlaklığı ayarlayarak ve şekilleri bozarak bu sorunu çözer. Bu değişiklikler, modellerin nesneleri farklı koşullarda tanımasına yardımcı olur. Sonuç olarak, modeller daha akıllı ve daha güvenilir hale gelir.

Artırılmış eğitimle, otonom sürüşlü arabalardaki Vision AI çözümleri daha iyi uyum sağlar ve daha güvenli kararlar verir. Daha doğru sonuçlar, daha az kaza ve gelişmiş navigasyon anlamına gelir.

‍

Otonom sürüşlü arabalar sadece bir örnek. Aslında, görüntü veri artırma, tıbbi görüntülemeden perakende analizine kadar çok çeşitli sektörlerde çok önemlidir. Bilgisayarlı görmeye dayanan herhangi bir uygulama, görüntü veri artırmadan potansiyel olarak faydalanabilir.

Önemli çıkarımlar

Görme yapay zeka sistemlerinin nesneleri farklı koşullarda tanıyabilmesi gerekir, ancak eğitim için sonsuz sayıda gerçek dünya görüntüsü toplamak zor olabilir. Görüntü verisi artırma, mevcut görüntülerin varyasyonlarını oluşturarak bunu çözer, modellerin daha hızlı öğrenmesine ve gerçek dünya koşullarında daha iyi performans göstermesine yardımcı olur. Doğruluğu artırarak YOLO11 gibi Vision AI modellerinin farklı ışıklandırma, açılar ve ortamlarla başa çıkabilmesini sağlar.

İşletmeler ve geliştiriciler için görüntü veri artırma, zamandan ve emekten tasarruf sağlarken bilgisayarlı görü modellerini daha güvenilir hale getirir. Sağlıktan otonom sürüşlü arabalara kadar birçok sektör buna bağlıdır. Vision AI gelişmeye devam ettikçe, artırma gelecekte daha akıllı ve daha uyarlanabilir modeller oluşturmanın önemli bir parçası olmaya devam edecektir.

Yapay zekayı iş başında görmek için topluluğumuza katılın ve GitHub depomuzu ziyaret edin. Lisanslama seçeneklerimizi keşfedin ve çözümler sayfalarımızda tarımda yapay zeka ve üretimde bilgisayarlı görme hakkında daha fazla bilgi edinin.

2025'te veri artırmaya yönelik nihai kılavuz

Görüntü veri artırma nedir?

Bilgisayar görüşünde veri artırmanın önemi

Görüntü veri artırmayı ne zaman kullanmalısınız?

Görüntü veri artırma nasıl çalışır?