Sözlük

U-Net

Anlamsal segmentasyon için güçlü CNN mimarisi olan U-Net'i keşfedin. Medikal, uydu ve otonom görüntülemedeki uygulamalarını öğrenin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

U-Net, başlangıçta biyomedikal görüntü segmentasyon görevleri için geliştirilmiş özel bir Evrişimsel Sinir Ağı (CNN) mimarisidir. Kendine özgü U şeklindeki yapısı, sınırlı eğitim verileriyle bile görüntülerdeki nesnelerin hassas bir şekilde konumlandırılmasını ve segmentasyonunu sağlar. Olaf Ronneberger, Philipp Fischer ve Thomas Brox tarafından 2015 yılında yayınlanan"U-Net: Biyomedikal Görüntü Segmentasyonu için Evrişimli Ağlar" başlıklı makalelerinde tanıttıkları U-Net, piksel düzeyinde sınıflandırma gerektiren çeşitli bilgisayarla görme (CV) uygulamalarındaki etkinliği nedeniyle kısa sürede başlangıçtaki etki alanının ötesine geçmiştir.

Çekirdek Mimari

U-Net mimarisi, 'U' harfine benzeyen bir şekilde birbirine bağlanan iki ana yoldan oluşur: bir daraltıcı yol (kodlayıcı olarak da bilinir) ve bir genişletici yol (kod çözücü olarak da bilinir).

  1. Sözleşme Yolu (Kodlayıcı): Bu yol, bir CNN'in tipik mimarisini takip eder. Her biri Rectified Linear Unit (ReLU ) aktivasyon fonksiyonu tarafından takip edilen iki adet 3x3 konvolüsyonun (dolgusuz konvolüsyon) tekrarlanan uygulamalarından ve ardından aşağı örnekleme için adım 2 ile 2x2 maksimum havuzlama işleminden oluşur. Her aşağı örnekleme adımında, özellik kanallarının sayısı iki katına çıkarılır. Bu yol, özellik bilgisini artırırken uzamsal çözünürlüğü kademeli olarak azaltarak giriş görüntüsünün bağlamını yakalar.
  2. Genişleyen Yol (Kod Çözücü): Bu yol, özellik haritasını yukarı örnekleme ve ardından özellik kanallarının sayısını yarıya indiren 2x2 konvolüsyon ("yukarı konvolüsyon"), daraltma yolundan gelen kırpılmış özellik haritasıyla birleştirme ve her biri bir ReLU tarafından takip edilen iki 3x3 konvolüsyon adımlarından oluşur. Kırpma işlemi, her bir konvolüsyondaki sınır piksellerinin kaybı nedeniyle gereklidir. Son katman, her bir özellik vektörünü istenen sayıda sınıfla eşlemek için 1x1 konvolüsyon kullanır. Bu yol, çıktının çözünürlüğünü kademeli olarak artırarak ve atlama bağlantıları aracılığıyla daralma yolundan gelen yüksek çözünürlüklü özelliklerle birleştirerek hassas yerelleştirme sağlar. U-Net gibi kodlayıcı-kod çözücü mimarileri segmentasyon görevlerinde yaygındır.
  3. Atlama Bağlantıları: Bu iki yolu birbirine bağlayan en önemli yenilik atlama bağlantılarının kullanılmasıdır. Bu bağlantılar, daralan yoldaki katmanlardan özellik haritalarını kopyalar ve bunları genişleyen yoldaki karşılık gelen yukarı örneklenmiş özellik haritalarıyla birleştirir. Bu, kod çözücünün kodlayıcı tarafından öğrenilen yüksek çözünürlüklü özelliklere doğrudan erişmesini sağlar; bu da hassas ayrıntılara sahip segmentasyon haritaları üretmek için çok önemlidir.

Temel Özellikler ve Avantajlar

U-Net'in tasarımı, özellikle segmentasyon görevleri için çeşitli avantajlar sunmaktadır:

  • Hassas Lokalizasyon: Atlama bağlantılarıyla birlikte genişleyen yol, ağın çok ince ayrıntılara sahip segmentasyon maskeleri oluşturmasına olanak tanır.
  • Küçük Veri Kümeleri ile Verimlilik: U-Net, tıbbi görüntü analizinde yaygın olan nispeten küçük eğitim veri kümeleriyle bile etkili bir şekilde eğitilebilir. Ağa istenen değişmezlikleri öğretmek için genellikle U-Net ile birlikte kapsamlı veri artırımı kullanılır.
  • Uçtan Uca Eğitim: Tüm ağ, giriş görüntülerinden çıkış segmentasyon haritalarına kadar doğrudan eğitilebilir ve bu da eğitim hattını basitleştirir.
  • İyi Genelleme: Sadece tıbbi görüntülemede değil, hassas segmentasyon gerektiren diğer alanlarda da güçlü performans göstermiştir.

Gerçek Dünya Uygulamaları

Başlangıçta biyomedikal görüntüleme için tasarlanmış olsa da, U-Net'in mimarisi çok yönlüdür ve çok sayıda uygulama için uyarlanmıştır:

  • Tıbbi Görüntü Analizi: Birincil uygulaması, MR taramaları(Beyin Tümörüveri kümesi örneği), BT taramaları ve tümör tespitiUltralytics tümör tespitiblogu), organ segmentasyonu ve hücre sayımı gibi görevler için mikroskopi görüntüleri gibi tıbbi görüntülerin segmentasyonunda kalır. Biyomedikal görüntü segmentasyonu incelemelerinde daha fazlasını okuyun. DICOM gibi standartlarla uyumlu analizlerin otomatikleştirilmesine yardımcı olur.
  • Uydu Görüntü Analizi: U-Net, arazi örtüsü sınıflandırması, yol ağı çıkarımı, bina ayak izi segmentasyonu ve uydu veya hava görüntülerinden çevresel değişiklikleri izlemek için kullanılır. Çeşitli uzaktan algılama uygulamalarını keşfedin.
  • Otonom Sürüş: Sahneyi anlamak için yol şeritlerini, yayaları ve diğer araçları bölümlere ayırma.
  • Endüstriyel Kalite Kontrol: Üretim süreçlerinde kusurları tespit etme veya bileşenleri segmentlere ayırma(Üretimde Yapay Zeka).
  • Tarım: Drone görüntülerinden ekinleri, yabani otları ayırmak veya bitki sağlığını değerlendirmek(Tarımda Yapay Zeka).

U-Net'i Benzer Kavramlardan Ayırt Etme

U-Net öncelikle semantik segmentasyona odaklanır ve bir görüntüdeki her piksele bir sınıf etiketi (örneğin, 'tümör', 'yol', 'bina') atar. Bu şundan farklıdır:

Eğitim ve Araçlar

Bir U-Net'in eğitilmesi, eğitim görüntülerindeki her pikselin ilgili sınıfla etiketlendiği piksel düzeyinde açıklamalı veriler gerektirir. Bu veri açıklama süreci, özellikle karmaşık tıbbi veya uydu görüntüleri için yoğun emek gerektirebilir. U-Net modelleri tipik olarak aşağıdaki gibi popüler derin öğrenme çerçeveleri kullanılarak uygulanır ve eğitilir PyTorchPyTorch resmi sitesi) ve TensorFlowTensorFlow resmi sitesi). OpenCV gibi kütüphaneler genellikle görüntü yükleme ve ön işleme için kullanılır. Ultralytics HUB gibi platformlar, karmaşık segmentasyon görevleri için bile veri kümelerini yönetmeye ve model eğitim sürecini kolaylaştırmaya yardımcı olabilir. Etkili eğitim genellikle dikkatli hiperparametre ayarını ve farklı optimizasyon algoritmalarını keşfetmeyi içerir.

Tümünü okuyun