Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Evrişimsel Sinir Ağı (CNN)

Convolutional Neural Networks (CNN'ler) modern bilgisayar görüşünü nasıl güçlendirdiğini keşfedin. Katmanlar, uygulamalar ve gerçek zamanlı AI için Ultralytics nasıl çalıştıracağınızı öğrenin.

Convolutional Neural Network (CNN), ızgara benzeri bir topolojiye sahip verileri, özellikle dijital görüntüleri işlemek için tasarlanmış özel bir derin öğrenme mimarisidir. Görsel korteksin biyolojik yapısından esinlenerek geliştirilen CNN'ler, girdi verileri içindeki uzamsal ilişkileri benzersiz bir şekilde koruma yeteneğine sahiptir. Görüntüyü uzun bir sayı listesine dönüştüren geleneksel sinir ağlarının aksine, CNN'ler görüntünün küçük, üst üste binen bölgelerini analiz ederek basit kenar ve dokulardan karmaşık şekil ve nesnelere kadar özelliklerin hiyerarşisini otomatik olarak öğrenir. Bu yetenek, CNN'leri modern bilgisayar görme (CV) sistemlerinin temel teknolojisi haline getirir. CNN'ler, görüntüleri ve diğer görsel verileri işleyen sistemlerde yaygın olarak kullanılır.

Evrişimsel Sinir Ağları Nasıl Çalışır?

CNN'nin gücü, karmaşık bir görüntüyü, iyi bir tahmin elde etmek için kritik olan özellikleri kaybetmeden işlenmesi daha kolay bir forma indirgeme yeteneğinde yatmaktadır. Bu, girdi hacmini bir çıktı sınıfına veya değerine dönüştüren farklı katmanlardan oluşan bir boru hattı aracılığıyla gerçekleştirilir:

  • Konvolüsyon Katmanı: Bu, temel yapı taşıdır. Giriş görüntüsü üzerinde bir el feneri gibi kayan bir dizi öğrenilebilir filtre (veya çekirdek) kullanır. Her konumda, filtre konvolüsyon adı verilen matematiksel bir işlem gerçekleştirerek, yatay çizgiler veya renk gradyanları gibi belirli desenleri vurgulayan bir özellik haritası oluşturur.
  • Aktivasyon Fonksiyonu: Konvolüsyondan sonra, çıktıya doğrusal olmayan bir fonksiyon uygulanır. En yaygın seçim, negatif piksel değerlerini sıfıra çeviren ReLU (Rectified Linear Unit) fonksiyonudur. Bu, doğrusal olmayanlık getirerek ağın basit doğrusal ilişkilerin ötesinde karmaşık kalıpları öğrenmesini sağlar. .
  • Havuzlama Katmanı: Aşağı örnekleme olarak da bilinen bu katman, özellik haritalarının boyutunu azaltır. Maksimum havuzlama gibi teknikler, bir bölgedeki yalnızca en önemli özellikleri (en yüksek değerleri) tutar, bu da hesaplama yükünü azaltır ve aşırı uyumlamayı önlemeye yardımcı olur. Özellik Haritalama Katmanı: Bu katman, özellik haritalarını birleştirir ve
  • Tam Bağlantılı Katman: Son aşamada, işlenen özellikler düzleştirilir ve standart bir sinir ağına (NN) beslenir. Bu katman, önceki katmanlar tarafından tanımlanan üst düzey özellikleri kullanarak "kedi" veya "köpek" gibi nihai bir sınıflandırma veya tahmin yapar.

Gerçek Dünya Uygulamaları

CNN'ler, görsel görevleri insanüstü bir doğrulukla otomatikleştirerek endüstrileri dönüştürdü. .

  • Tıbbi Teşhis: Sağlık hizmetlerinde CNN'ler, tıbbi taramalarda insan gözünden daha hızlı bir şekilde anormallikleri tespit ederek radyologlara yardımcı olur. Örneğin, derin öğrenme modelleri MRI ve CT taramalarını analiz ederek tümörlerin veya kırıkların detect belirtilerini detect . Radyolojide AI ileilgili araştırmalar, bu araçların teşhis tutarlılığını ve hızını nasıl iyileştirdiğini vurgulamaktadır.
  • Otonom Sistemler: Otonom araçlar, çevrelerini algılamak için büyük ölçüde CNN'lere güvenmektedir. YOLO26 gibi modeller, verimli CNN omurgalarını kullanarak gerçek zamanlı nesne algılama gerçekleştirir, yayaları, trafik işaretlerini ve diğer araçları tanımlayarak anlık sürüş kararları verir.

CNN'ler ve Görme Dönüştürücüler (ViT)

CNN'ler uzun süredir görme görevleri için standart olsa da, Vision Transformer (ViT) adlı yeni bir mimari ortaya çıkmıştır.

  • CNN'ler, yerel özellikleri kullanarak görüntüleri işler ve "tümevarımsal önyargı" (yakındaki piksellerin birbiriyle ilişkili olduğunu varsayarlar) nedeniyle daha küçük veri kümelerinde oldukça verimlidir. Kenar cihazlarda gerçek zamanlı çıkarım gerektiren senaryolarda mükemmeldirler.
  • ViT'ler görüntüleri parçalara ayırır ve bunları global self-attention mekanizmaları kullanarak işler. Bu, görüntüdeki uzun menzilli bağımlılıkları yakalamalarını sağlar, ancak genellikle etkili bir şekilde eğitmek için büyük veri setleri ve daha fazla hesaplama gücü gerektirir.

Uygulama Örneği

Modern kütüphaneler, CNN tabanlı modellerin kullanımını kolaylaştırır. ultralytics paket, hızlı çıkarım için yüksek düzeyde optimize edilmiş CNN mimarileri içeren YOLO26 gibi son teknoloji modellere erişim sağlar.

Aşağıdaki örnek, önceden eğitilmiş bir CNN modelini yüklemeyi ve bir tahmin çalıştırmayı göstermektedir:

from ultralytics import YOLO

# Load a YOLO26 model, which uses an advanced CNN architecture
model = YOLO("yolo26n.pt")

# Run inference on an image to identify objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the prediction results
results[0].show()

Gelişim Araçları

CNN'lerin geliştirilmesi, açık kaynaklı araçlardan oluşan sağlam bir ekosistem tarafından desteklenmektedir. Mühendisler genellikle PyTorch veya TensorFlow kullanır. Bu kütüphaneler, konvolüsyon ve geri yayılım için gerekli olan düşük seviyeli tensor sağlar. .

Veri toplama aşamasından uygulamaya kadar bilgisayar görme projelerinin yaşam döngüsünü kolaylaştırmak isteyen ekipler için Ultralytics kapsamlı bir çözüm sunar. Karmaşık iş akışlarını basitleştirerek geliştiricilerin altyapıyı yönetmek yerine CNN'leri iş sorunlarını çözmek için uygulamaya odaklanmalarını sağlar . Ayrıca modeller ONNX veya TensorRT gibi formatlara aktarılabilir.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın