Sözlük

U-Net

Anlamsal segmentasyon için güçlü CNN mimarisi olan U-Net'i keşfedin. Medikal, uydu ve otonom görüntülemedeki uygulamalarını öğrenin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

U-Net, başlangıçta biyomedikal görüntü segmentasyon görevleri için geliştirilmiş özel bir Evrişimsel Sinir Ağı (CNN) mimarisidir. Kendine özgü U şeklindeki yapısı, sınırlı eğitim verileriyle bile görüntülerdeki nesnelerin hassas bir şekilde konumlandırılmasını ve segmentasyonunu sağlar. Olaf Ronneberger, Philipp Fischer ve Thomas Brox tarafından 2015 yılında tanıtılan U-Net, piksel düzeyinde sınıflandırma gerektiren çeşitli bilgisayarla görme (CV) uygulamalarındaki etkinliği nedeniyle kısa sürede başlangıçtaki etki alanının ötesinde etkili oldu.

Çekirdek Mimari

U-Net mimarisi iki ana yoldan oluşur: karakteristik 'U' şeklini oluşturan bir daraltıcı yol (kodlayıcı) ve bir genişletici yol (kod çözücü).

  1. Sözleşme Yolu (Kodlayıcı): Bu tipik bir CNN yapısını takip eder. Tekrarlanan konvolüsyon uygulamalarını, ardından ReLU (Rectified Linear Unit) aktivasyon fonksiyonlarını ve maksimum havuzlama işlemlerini içerir. Bu yol, özellik haritalarının sayısını artırırken uzamsal çözünürlüğü kademeli olarak azaltarak giriş görüntüsünün bağlamını yakalar ve görüntüyü etkili bir şekilde kompakt bir temsile kodlar. Bu kavram birçok kodlayıcı-kod çözücü mimarisi için temeldir.
  2. Genişleyen Yol (Kod Çözücü): Bu yol, özellik haritalarını simetrik olarak orijinal görüntü çözünürlüğüne geri genişletir. Çözünürlüğü artıran yukarı konvolüsyonlardan (veya transpoze konvolüsyonlardan) ve ardından standart konvolüsyonlardan oluşur. En önemlisi, genişleyen yoldaki her adım, yukarı konvolüsyonlu özellik haritasını atlama bağlantıları aracılığıyla daralan yoldan gelen karşılık gelen yüksek çözünürlüklü özellik haritasıyla birleştirir.
  3. Bağlantıları Atla: Bunlar U-Net'in ayırt edici özelliğidir. Kodlayıcıdaki özellik haritalarını doğrudan kod çözücüdeki ilgili katmanlara bağlarlar. Bu, kod çözücünün kodlayıcı tarafından öğrenilen ve nihai segmentasyon haritasında hassas lokalizasyon elde etmek için hayati önem taşıyan yüksek çözünürlüklü uzamsal bilgileri yeniden kullanmasına olanak tanır. Atlama bağlantılarının bir açıklaması daha fazla bağlam sağlayabilir.

Temel Özellikler ve Avantajlar

U-Net'in tasarımı, özellikle segmentasyon görevleri için çeşitli avantajlar sunmaktadır:

  • Hassas Lokalizasyon: Atlama bağlantıları, ağın derin, bağlamsal bilgileri (kodlayıcının alt katmanlarından) ince taneli uzamsal ayrıntılarla (kodlayıcının önceki katmanlarından) birleştirmesini sağlar.
  • Sınırlı Veri ile Verimlilik: Açıklamalı verilerin az olabileceği tıbbi görüntü analizinde yaygın bir senaryo olan daha küçük veri kümelerinde bile iyi performans gösterir.
  • Uçtan Uca Eğitim: Tüm ağ, giriş görüntüsünden çıkış segmentasyon haritasına kadar doğrudan eğitilebilir.

Gerçek Dünya Uygulamaları

Başlangıçta biyomedikal görüntüleme için tasarlanmış olsa da U-Net'in mimarisi çok yönlüdür:

  • Tıbbi Görüntü Segmentasyonu: Mikroskopi görüntülerindeki hücreleri segmentlere ayırma, CT veya MRI taramalarındaki tümörleri tanımlama ve organların yerini belirleme gibi görevler için kullanılan birincil uygulamasıdır. Orijinal U-Net makalesi, hücre izleme zorluklarındaki başarısını detaylandırmaktadır. Biyomedikal görüntü segmentasyonu incelemelerinde daha fazla örnek bulabilirsiniz.
  • Uydu Görüntü Analizi: U-Net, arazi örtüsünü haritalamak, yolları veya binaları tespit etmek ve çevresel değişiklikleri izlemek için uydu görüntü analizinde kullanılır. Çeşitli uzaktan algılama uygulamaları U-Net varyantlarından yararlanır.

U-Net'i Benzer Kavramlardan Ayırt Etme

U-Net öncelikle her piksele bir sınıf etiketi atayarak anlamsal segmentasyona odaklanır. Bu, aynı sınıfa ait nesnelerin tek tek örneklerini ayırt eden örnek segmentasyonundan farklıdır. U-Net örnek segmentasyonu için uyarlanabilirken, Mask R-CNN gibi modeller genellikle bu görev için daha doğrudan uygundur. Gibi modern modeller Ultralytics YOLOv8 Ayrıca, genellikle hız ve gerçek zamanlı performans için optimize edilmiş, potansiyel olarak derin öğrenmedeki gelişmelerden etkilenen farklı mimari yaklaşımlar kullanan güçlü segmentasyon yetenekleri sunar.

Eğitim ve Araçlar

Bir U-Net'in eğitilmesi, eğitim görüntülerindeki her pikselin ilgili sınıfla etiketlendiği piksel düzeyinde açıklamalı veriler gerektirir. Veri açıklama olarak bilinen bu süreç genellikle yoğun emek gerektirir. U-Net modelleri tipik olarak aşağıdaki gibi popüler derin öğrenme çerçeveleri kullanılarak uygulanır ve eğitilir PyTorch ve TensorFlow.

Tümünü okuyun