Anlamsal segmentasyon için güçlü CNN mimarisi olan U-Net'i keşfedin. Medikal, uydu ve otonom görüntülemedeki uygulamalarını öğrenin.
U-Net, başlangıçta biyomedikal görüntü segmentasyon görevleri için geliştirilmiş özel bir Evrişimsel Sinir Ağı (CNN) mimarisidir. Kendine özgü U şeklindeki yapısı, sınırlı eğitim verileriyle bile görüntülerdeki nesnelerin hassas bir şekilde konumlandırılmasını ve segmentasyonunu sağlar. Olaf Ronneberger, Philipp Fischer ve Thomas Brox tarafından 2015 yılında tanıtılan U-Net, piksel düzeyinde sınıflandırma gerektiren çeşitli bilgisayarla görme (CV) uygulamalarındaki etkinliği nedeniyle kısa sürede başlangıçtaki etki alanının ötesinde etkili oldu.
U-Net mimarisi iki ana yoldan oluşur: karakteristik 'U' şeklini oluşturan bir daraltıcı yol (kodlayıcı) ve bir genişletici yol (kod çözücü).
U-Net'in tasarımı, özellikle segmentasyon görevleri için çeşitli avantajlar sunmaktadır:
Başlangıçta biyomedikal görüntüleme için tasarlanmış olsa da U-Net'in mimarisi çok yönlüdür:
U-Net öncelikle her piksele bir sınıf etiketi atayarak anlamsal segmentasyona odaklanır. Bu, aynı sınıfa ait nesnelerin tek tek örneklerini ayırt eden örnek segmentasyonundan farklıdır. U-Net örnek segmentasyonu için uyarlanabilirken, Mask R-CNN gibi modeller genellikle bu görev için daha doğrudan uygundur. Gibi modern modeller Ultralytics YOLOv8 Ayrıca, genellikle hız ve gerçek zamanlı performans için optimize edilmiş, potansiyel olarak derin öğrenmedeki gelişmelerden etkilenen farklı mimari yaklaşımlar kullanan güçlü segmentasyon yetenekleri sunar.
Bir U-Net'in eğitilmesi, eğitim görüntülerindeki her pikselin ilgili sınıfla etiketlendiği piksel düzeyinde açıklamalı veriler gerektirir. Veri açıklama olarak bilinen bu süreç genellikle yoğun emek gerektirir. U-Net modelleri tipik olarak aşağıdaki gibi popüler derin öğrenme çerçeveleri kullanılarak uygulanır ve eğitilir PyTorch ve TensorFlow.