Yeşil çek
Panoya kopyalanan bağlantı

Verilerinizi çeşitlendirmek için Albümantasyon artırımlarını kullanma

Çeşitli eğitim verileriyle model performansını iyileştirmek için Ultralytics YOLO11 'i özel olarak eğitirken artırmalar için Albumentations'ı nasıl kullanacağınızı öğrenin.

Bir bilgisayarla görme çözümü oluştururken, Vision AI modellerini eğitmek için çeşitli görüntüler toplamak sürecin çok önemli bir parçası olabilir. Genellikle çok fazla zaman ve para gerektirir ve bazen toplanan görüntüler modellerin etkili bir şekilde öğrenmesi için yeterince çeşitli değildir.

Örneğin, bilgisayarla görme modelleri Ultralytics YOLO11 farklı uygulamalarla ilgili çeşitli bilgisayarla görme görevleri için görüntü veri kümeleri üzerinde özel olarak eğitilebilir. Farklı veriler önemlidir çünkü modelin daha iyi genelleşmesine yardımcı olarak çok çeşitli gerçek dünya senaryolarındaki nesneleri ve desenleri tanımasına olanak tanır.

Çeşitli veri eksikliği ile mücadele ediyorsanız, görüntü verisi artırma teknikleri harika bir çözüm olabilir. Döndürme, çevirme ve parlaklığı ayarlama gibi yöntemler, veri setinizin çeşitliliğini artırmaya yardımcı olabilir ve modelin daha geniş bir koşul yelpazesini ele alma yeteneğini geliştirebilir.

Bu nedenle Ultralytics , görüntü verilerinin artırılması için bir entegrasyonu destekler. Bir dönüşüm koleksiyonu sunan popüler bir araç olan Albumentations'ı kullanarak çeşitli görsel veriler oluşturabilirsiniz. Bu entegrasyon, eğitim görüntülerini otomatik olarak artırarak YOLO11 eğitim sürecini basitleştirir ve model performansının artmasını sağlar. 

Bu makalede, Albumentations entegrasyonunu nasıl kullanabileceğinizi, faydalarını ve model eğitimi üzerindeki etkisini inceleyeceğiz.

Albümantasyon nedir?

Bilgisayarla görme modelleri, farklı ortamlardaki nesneleri tanımak için geniş bir yüksek kaliteli görüntü setinden öğrenebilir. Gerçek dünya kaynaklarından büyük veri kümeleri toplamak yavaş, maliyetli ve verimsiz olabilir. Bu görevi kolaylaştırmak için, mevcut görüntülerin yeni varyasyonlarını oluşturmak üzere görüntü veri artırımını kullanabilir ve modellerin daha fazla veri toplamadan farklı senaryolardan öğrenmesine yardımcı olabilirsiniz.

Özellikle, 2018'de verimli görüntü verisi artırımı için sunulan açık kaynaklı bir kütüphane olan Albumentations'tan yararlanabilirsiniz. Döndürme ve çevirme gibi basit geometrik değişikliklerden parlaklık, kontrast ve gürültü ekleme gibi daha karmaşık ayarlamalara kadar çeşitli işlemleri destekler.

Şekil 1. Farklı görüntü verisi artırma türlerine örnekler.

Albumentations'ın temel özellikleri

Albumentations yüksek performansıyla bilinir, yani görüntüleri hızlı ve verimli bir şekilde işleyebilir. OpenCV ve NumPy gibi optimize edilmiş kütüphaneler üzerine inşa edilen Albumentations, büyük veri kümelerini minimum işlem süresiyle işleyerek model eğitimi sırasında hızlı veri artırımı için idealdir.

İşte Albumentations'ın diğer bazı temel özellikleri:

  • Geniş dönüşüm yelpazesi: Albumentations 70'in üzerinde çeşitlilik sağlar. Bu varyasyonlar, modellerin ışık, açı veya arka plandaki değişikliklere rağmen nesneleri algılamayı öğrenmesine yardımcı olur.
  • Hız için optimize edilmiştir: Görüntü büyütmeyi hızlandırmak ve büyük veri kümelerini verimli bir şekilde işlemek için aynı anda birden fazla veri noktasını işleyen SIMD (Tek Komut, Çoklu Veri) gibi gelişmiş optimizasyon teknikleri kullanır.
  • Üç seviye artırma: Verileri üç şekilde geliştirir. Örneğin, piksel düzeyindeki büyütmeler nesneleri değiştirmeden parlaklığı ve rengi ayarlar. Bu arada, uzamsal düzeydeki büyütmeler önemli ayrıntıları korurken nesne konumunu değiştirir ve karıştırma düzeyindeki büyütmeler yeni örnekler oluşturmak için farklı görüntülerin parçalarını harmanlar.

Albumentations entegrasyonunu neden kullanmalısınız?

Merak ediyor olabilirsiniz: Bir veri kümesine büyütme uygulamanın birçok yolu vardır ve hatta OpenCV gibi araçları kullanarak kendiniz bile oluşturabilirsiniz. Peki, neden Albumentations gibi bir kütüphaneyi destekleyen bir entegrasyon seçmelisiniz?

OpenCV gibi araçlarla manuel olarak büyütmeler oluşturmak çok zaman alabilir ve biraz uzmanlık gerektirir. En iyi sonuçları elde etmek için dönüşümlere ince ayar yapmak da zor olabilir. Albumentations entegrasyonu bu süreci kolaylaştırır. Veri setinizi hazırlarken size zaman ve emek kazandırabilecek birçok kullanıma hazır dönüşüm sunar.

Albumentations entegrasyonunu seçmenin bir başka nedeni de Ultralytics model eğitim hattı ile sorunsuz çalışmasıdır. Arttırmalar eğitim sırasında otomatik olarak uygulandığından, YOLO11'i özel olarak eğitmeyi çok daha kolay hale getirir. Süreci basitleştirir, böylece veri hazırlama ile uğraşmak yerine modelinizi geliştirmeye daha fazla odaklanabilirsiniz. 

Albumentations entegrasyonunu kullanmaya başlama

İlginç bir şekilde, YOLO11 'i eğitmek için Albumentations entegrasyonlarını kullanmak göründüğünden daha basittir. Doğru kütüphaneler kurulduktan sonra, entegrasyon eğitim sırasında otomatik olarak görüntü verisi artırımları uygular. Modelin aynı veri kümesini kullanarak farklı görüntü varyasyonlarından öğrenmesine yardımcı olur.

Daha sonra, YOLO11'i özel olarak eğitirken Albumentations entegrasyonunun nasıl kurulacağını ve kullanılacağını inceleyelim.

Ultralytics Python paketini ve Albumentations'ı yükleme

Büyütmeleri uygulamadan önce, hem Ultralytics Python paketinin hem de Albumentations'ın yüklenmesi gerekir. Entegrasyon, her iki kütüphanenin de varsayılan olarak sorunsuz bir şekilde birlikte çalışacağı şekilde oluşturulmuştur, bu nedenle karmaşık yapılandırmalar hakkında endişelenmenize gerek yoktur.

Tüm yükleme işlemi, aşağıdaki resimde gösterildiği gibi Python kütüphanelerini yüklemek için bir paket yönetim aracı olan tek bir pip komutu ile sadece birkaç dakika içinde tamamlanabilir. 

Şekil 2. Ultralytics ve Albümantasyonların Kurulumu.

Albumentations yüklendikten sonra, Ultralytics model eğitim modu eğitim sırasında görüntü büyütmelerini otomatik olarak uygular. Albumentations yüklü değilse, bu büyütmeler uygulanmayacaktır. Daha fazla ayrıntı için resmi Ultralytics belgelerine başvurabilirsiniz.

Albumentations entegrasyonu yardımıyla YOLO11 eğitimi

Albumentations entegrasyonunun kaputunun altında neler olduğunu daha iyi anlayalım. 

İşte YOLO11 eğitimi sırasında uygulanan güçlendirmelere daha yakından bir bakış:

  • Bulanıklık: Bu dönüşüm görüntüye hafif bir bulanıklık ekler. Modelin nesneleri odak dışında olsalar bile algılamasına yardımcı olur.
  • Medyan bulanıklık: Bir görüntüdeki nesne kenarlarını korurken rastgele gürültüyü azaltır. Bu, modelin karmaşık ortamlardaki nesneleri tespit etmesini kolaylaştırır.
  • Gri tonlama: Bir görüntüyü siyah beyaza dönüştürerek, bu artırma modelin renkler yerine şekillere ve dokulara odaklanmasına yardımcı olabilir.
  • CLAHE (Kontrast sınırlı uyarlanabilir histogram eşitleme): Bu artırma, özellikle düşük ışık veya puslu koşullar gibi çok karanlık veya görülmesi zor alanlarda görüntülerdeki kontrastı artırır. Bu, söz konusu alanlardaki nesneleri daha net hale getirir ve modelin tanımlamasını kolaylaştırır.
Şekil 3. Bir kedi görüntüsüne uygulanan gri tonlama büyütme örneği.

YOLO11 ve Albumentations entegrasyonunun uygulamaları

YOLO11 'i belirli bir uygulama için özel olarak eğitiyorsanız, Albumentations entegrasyonu çeşitli koşullara uyum sağlayarak modelin performansını artırmaya yardımcı olabilir. Bazı gerçek dünya uygulamalarını ve bu entegrasyonun çözebileceği zorlukları tartışalım.

Tıbbi görüntülemenin iyileştirilmesi

Sağlık hizmetlerinde yapay zeka, doktorların tıbbi görüntüleri daha doğru bir şekilde analiz ederek teşhislere yardımcı olmalarına ve hasta bakımını iyileştirmelerine yardımcı oluyor. Aslında, sağlık kuruluşlarının yaklaşık beşte biri halihazırda yapay zeka çözümlerini kullanıyor. 

Ancak, bu bilgisayarla görme çözümlerini oluşturmak kendi zorluklarını da beraberinde getiriyor. Tıbbi taramalar, farklı ekipmanlar, ayarlar ve hatta teknisyenlerin deneyimi gibi faktörlerden etkilenerek hastaneler arasında büyük farklılıklar gösterebilir. Parlaklık, kontrast ve pozlamadaki farklılıklar Vision AI modellerinin tutarlılığını ve doğruluğunu etkileyerek farklı ortamlarda güvenilir bir şekilde performans göstermelerini zorlaştırabilir.

İşte bu noktada Albumentations gibi araçların entegrasyonu önem kazanıyor. Albumentations, aynı taramanın birden fazla artırılmış versiyonunu oluşturarak modelin çeşitli görüntü kalitelerinden öğrenmesini sağlar. Bu, modelin daha sağlam olmasına yardımcı olarak hem yüksek hem de düşük kaliteli görüntülerde hastalıkları doğru bir şekilde tespit etmesini sağlar. 

Şekil 4. Artırılmış X-ray görüntüleri.

Güvenlik ve gözetimin artırılması

Vision AI'nın bir başka ilginç uygulaması da güvenlik ve gözetimdir. Gerçek zamanlı nesne algılama, güvenlik ekiplerinin potansiyel tehditleri hızla tespit etmesine yardımcı olabilir. 

Bu uygulamayla ilgili temel endişe, güvenlik kameralarının gün boyunca çeşitli aydınlatma koşulları altında görüntü çekmesi ve bu koşulların bir modelin bu tür görüntüleri nasıl anladığını önemli ölçüde etkileyebilmesidir. Düşük ışıklı ortamlar, parlama veya zayıf görüş gibi faktörler bilgisayarla görme modellerinin nesneleri tespit etmesini veya potansiyel tehditleri tutarlı bir şekilde tanımasını zorlaştırabilir.

Albumentations entegrasyonu, farklı aydınlatma koşullarını taklit etmek için dönüşümler uygulayarak yardımcı olur. Bu, modelin hem parlak hem de düşük ışıklı ortamlarda nesneleri algılamayı öğrenmesini sağlayarak onu daha güvenilir hale getirir ve zorlu koşullarda yanıt sürelerini iyileştirir.

Perakende iş akışlarının ve müşteri deneyiminin yeniden tanımlanması

Süpermarket koridoruna dökülen bir su, mağazanın içinde koşan bir köpek veya ürün teşhirini deviren bir çocuk, perakende ortamlarında Görme Yapay Zekası için uç örnekler olabilecek günlük olaylardan sadece birkaçıdır. Bilgisayarla görme, müşteri davranışını izleyerek, yaya trafiğini takip ederek ve raflardaki ürünleri tanımlayarak müşteri deneyimini iyileştirmek için giderek daha fazla kullanılmaktadır. Ancak, bu gerçek dünya durumlarının yapay zeka sistemleri tarafından anlaşılması ve doğru bir şekilde işlenmesi zor olabilir.

Her senaryo bir bilgisayarlı görü veri setinde temsil edilemese de Albumentations entegrasyonu, beklenmedik aydınlatma, alışılmadık açılar veya engeller gibi birçok olası durumu kapsayacak şekilde verileri artırarak yardımcı olur. Bu, bilgisayarlı görü modellerinin çeşitli koşullara uyum sağlamasına yardımcı olarak uç durumları ele alma ve dinamik perakende ortamlarında doğru tahminler yapma becerilerini geliştirir.

Önemli çıkarımlar

Model eğitimi için çeşitli gerçek dünya verilerini toplamak karmaşık olabilir, ancak Albumentations, modellerin farklı koşullara uyum sağlamasına yardımcı olan görüntü varyasyonları oluşturarak bunu kolaylaştırır. 

Ultralytics tarafından desteklenen Albumentations entegrasyonu, YOLO11'i özel olarak eğitirken bu artırımları uygulama sürecini basitleştirir. Bu, daha doğru ve güvenilir Vision AI modelleri üreterek çok çeşitli endüstrilere fayda sağlayan daha iyi veri seti kalitesi ile sonuçlanır.

Topluluğumuza katılın ve yapay zeka hakkında daha fazla bilgi edinmek için GitHub depomuzu keşfedin ve Vision AI projelerinizi başlatmak için lisanslama seçeneklerimize göz atın. Üretimde yapay zeka veya otonom sürüşte bilgisayarla görme gibi yeniliklerle ilgileniyor musunuz? Daha fazlasını keşfetmek için çözüm sayfalarımızı ziyaret edin. 

Facebook logosuTwitter logosuLinkedIn logosuKopya-bağlantı sembolü

Bu kategoride daha fazlasını okuyun

Yapay zekanın gelecekteki
adresini birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın