Sözlük

Kapsül Ağları (CapsNet)

Kapsül Ağlarını (CapsNets) keşfedin: Mekansal hiyerarşilerde ve özellik ilişkilerinde mükemmel olan çığır açan bir sinir ağı mimarisi.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Genellikle CapsNets olarak adlandırılan Kapsül Ağları, geleneksel Evrişimsel Sinir Ağlarının (CNN'ler) bazı sınırlamalarını, özellikle de görüntülerdeki özellikler arasındaki uzamsal hiyerarşileri ve ilişkileri ele almak için tasarlanmış yeni bir sinir ağı mimarisi türünü temsil eder. Havuzlama işlemlerinden elde edilen skaler çıktıları kullanan CNN'lerin aksine CapsNets, özellikleri temsil etmek için vektörler kullanır ve nesnelerin yönü ve göreceli uzamsal konumları hakkında daha ayrıntılı bilgi yakalamalarını sağlar. Bu özellik CapsNets'i, nesnelerin pozunu ve uzamsal ilişkilerini anlamanın çok önemli olduğu görüntü tanıma gibi görevlerde özellikle etkili kılar.

Temel Kavramlar

CapsNets, aktivite vektörü bir nesne veya nesne parçası gibi belirli bir varlık türünün çeşitli özelliklerini temsil eden nöron grupları olan "kapsüller" kavramını ortaya koymaktadır. Aktivite vektörünün uzunluğu, varlığın var olma olasılığını temsil ederken, yönelimi örnekleme parametrelerini (örneğin, konum, boyut, yönelim) kodlar. Bir seviyedeki aktif kapsüller, dönüşüm matrisleri aracılığıyla daha üst seviyedeki kapsüllerin örnekleme parametreleri için tahminlerde bulunur. Birden fazla tahmin aynı fikirde olduğunda, daha yüksek seviyeli bir kapsül aktif hale gelir. Bu süreç "anlaşmaya göre yönlendirme" olarak bilinir.

Evrişimsel Sinir Ağlarından (CNN'ler) Temel Farklılıklar

Hem CapsNets hem de Evrişimsel Sinir Ağları (CNN'ler) bilgisayarla görme (CV) görevlerinde kullanılırken, uzamsal bilgileri işleme yaklaşımlarında önemli farklılıklar gösterirler:

  • Özellik Temsili: CNN'ler özellikleri temsil etmek için skaler değerler kullanırken, CapsNets vektörler kullanır ve nesnelerin pozu ve özellikleri hakkında daha ayrıntılı bilgi yakalamalarını sağlar.
  • Havuzlama İşlemleri: CNN'ler genellikle maksimum havuzlama kullanır ve bu da kesin mekansal bilgi kaybına yol açabilir. CapsNets, uzamsal hiyerarşileri koruyan dinamik yönlendirme kullanarak bundan kaçınır.
  • Eşdeğişkenlik: CapsNets, bakış açısındaki değişikliklere karşı eşdeğer olacak şekilde tasarlanmıştır, yani yönleri değişse bile nesneleri tanıyabilirler. CNN'ler doğası gereği eşdeğişken değildir ve benzer sonuçlar elde etmek için veri artırma gibi teknikler gerektirir.

Kapsül Ağlarının Avantajları

CapsNets, geleneksel CNN'lere göre çeşitli avantajlar sunar:

  • Mekansal Hiyerarşilerin Geliştirilmiş Kullanımı: CapsNets, özellikleri vektörler olarak temsil ederek bir nesnenin parçaları arasındaki uzamsal ilişkileri daha iyi anlayabilir.
  • Afin Dönüşümlere Karşı Geliştirilmiş Sağlamlık: CapsNets, kapsamlı veri artırımına ihtiyaç duymadan çeşitli dönüşümler (örn. döndürme, ölçekleme) altındaki nesneleri tanıyabilir.
  • Daha Az Veri ile Daha İyi Genelleme: Ayrıntılı özellik bilgilerini yakalama yetenekleri nedeniyle CapsNets, CNN'lere kıyasla daha az eğitim örneği ile genellikle iyi performans elde edebilir.

Gerçek Dünya Uygulamaları

Kapsül Ağları çeşitli uygulamalarda umut vaat ederek derin öğrenme (DL) alanını ilerletme potansiyellerini göstermiştir:

  • Tıbbi Görüntüleme: Tıbbi görüntü analizinde CapsNets, farklı anatomik yapılar arasındaki uzamsal ilişkileri daha iyi anlayarak hastalıkların teşhis doğruluğunu artırabilir. Örneğin, bir organ içindeki şekillerini, boyutlarını ve göreceli konumlarını analiz ederek tümörleri daha doğru bir şekilde tespit etmek ve sınıflandırmak için kullanılabilirler.
  • Otonom Araçlar: CapsNets, özellikle değişen bakış açıları ve tıkanıklıklar gibi zorlu koşullarda nesne alg ılama ve tanımayı geliştirerek otonom araçların algılama sistemlerini geliştirebilir. Bu, daha güvenli ve daha güvenilir navigasyona yol açabilir.
  • Yüz Tanıma: Yüz tanıma sistemlerinde CapsNets, poz ve ifadedeki değişiklikler altında bile yüz özellikleri arasındaki uzamsal ilişkileri doğru bir şekilde yakalayarak daha sağlam performans sağlayabilir.

Zorluklar ve Gelecek Yönelimleri

Avantajlarına rağmen CapsNets, CNN'lere kıyasla daha yüksek hesaplama karmaşıklığı ve mimarilerini ve eğitim prosedürlerini optimize etmek için daha fazla araştırmaya ihtiyaç duyulması gibi zorluklarla da karşı karşıyadır. Devam eden araştırmalar, dinamik yönlendirmenin verimliliğini artırmaya, yeni kapsül türlerini keşfetmeye ve CapsNets'i görüntü tanımanın ötesinde daha geniş bir görev yelpazesine uygulamaya odaklanmaktadır.

Yapay zeka (AI) alanı gelişmeye devam ederken, Kapsül Ağları daha sağlam ve çok yönlü sinir ağı modelleri oluşturmak için yeni olanaklar sunan heyecan verici bir gelişim alanını temsil etmektedir. Ayrıntılı uzamsal bilgileri yakalama ve dönüşümleri işleme yetenekleri, onları bilgisayarla görme ve diğer yapay zeka uygulamalarını ilerletmek için değerli bir araç haline getiriyor. En yeni yapay zeka modellerini keşfetmek isteyenler için Ultralytics YOLO modelleri, alandaki en son gelişmelerden bazılarını içeren son teknoloji ürünü nesne algılama mimarileri sunmaktadır. Ayrıca Ultralytics HUB, bu modellerin eğitimi ve dağıtımı için bir platform sağlayarak gelişmiş YZ çözümlerinin geliştirilmesini ve uygulanmasını daha da kolaylaştırmaktadır.

Tümünü okuyun