Bilgisayar görüşünde görüntü segmentasyonunu keşfedin. Ultralytics örnek, semantik ve panoptik segmentasyon için hassas piksel düzeyinde maskeler sağlama yöntemini öğrenin.
Görüntü segmentasyonu, bilgisayar görme (CV) alanında kullanılan sofistike bir tekniktir ve dijital görüntünün genellikle görüntü segmentleri veya bölgeleri olarak adlandırılan çok sayıda alt piksele bölünmesini içerir. Görüntünün tamamına tek bir etiket atayan standart görüntü sınıflandırmasından farklı olarak, segmentasyon her bir piksele belirli bir sınıf etiketi atayarak görsel verileri çok daha ayrıntılı bir düzeyde analiz eder. Bu işlem, yapay zeka (AI) modellerinin sadece hangi nesnelerin mevcut olduğunu değil, bunların tam olarak nerede bulunduğunu ve belirli sınırlarının ne olduğunu da anlamasını sağlayan kesin bir piksel düzeyinde harita oluşturur.
Bu yüksek doğruluklu anlayışı elde etmek için, segmentasyon modelleri genellikle derin öğrenme (DL) mimarilerini, özellikle de Convolutional Neural Networks (CNN) kullanır. Bu ağlar, kenarlar, dokular ve karmaşık şekiller gibi kalıpları tanımlayarak güçlü özellik çıkarıcılar olarak işlev görür. Klasik U-Net gibi geleneksel segmentasyon mimarileri genellikle bir kodlayıcı-kod çözücü yapısı kullanır. Kodlayıcı giriş görüntüsünü sıkıştırarak anlamsal bağlamı yakalar, kod çözücü ise uzamsal ayrıntıları yeniden yapılandırarak nihai segmentasyon maskesini çıkarır.
Modern gelişmeler, 2026 yılının Ocak ayında piyasaya sürülen YOLO26 gibi gerçek zamanlı mimarilerin ortaya çıkmasına neden olmuştur. Bu modeller, bölümleme yeteneklerini doğrudan uçtan uca bir boru hattına entegre ederek, bulut GPU'lardan uç cihazlara kadar çeşitli donanımlarda yüksek hızlı işleme imkanı sunmaktadır.
Bir projenin belirli hedefine bağlı olarak, geliştiriciler genellikle üç ana segmentasyon tekniği arasından seçim yaparlar:
Segmentasyonu nesne algılamadan ayırmak çok önemlidir. Algılama algoritmaları, dikdörtgen bir sınırlayıcı kutu kullanarak öğeleri yerleştirirken, kaçınılmaz olarak bu kutunun içine arka plan piksellerini de dahil ederler. Segmentasyon, nesnenin tam konturunu veya poligonunu izleyerek daha sıkı ve daha doğru bir temsil sağlar. Bu fark, robot kolunun çarpışma olmadan bir öğeyi manipüle etmek için onun kesin geometrisini bilmesi gereken robotik kavrama gibi uygulamalar için hayati önem taşır.
Görüntü segmentasyonunun sağladığı hassasiyet, çeşitli sektörlerde yenilikçiliği teşvik eder:
Geliştiriciler, ultralytics Python .
Aşağıdaki örnek, son teknoloji ürünü YOLO26 modeli,
hem hız hem de doğruluk açısından optimize edilmiştir.
from ultralytics import YOLO
# Load a pre-trained YOLO26 segmentation model
# 'n' denotes the nano version, optimized for speed
model = YOLO("yolo26n-seg.pt")
# Run inference on an image to generate masks
# The model identifies objects and outlines their shape
results = model("https://ultralytics.com/images/bus.jpg")
# Display the image with segmentation overlays
results[0].show()
Özel görevlerde yüksek performans elde etmek için, ekipler genellikle yüksek kaliteli eğitim verilerini düzenlemeleri gerekir. Ultralytics , poligon maskeleriyle görüntülere açıklama ekleme, veri kümelerini yönetme ve bulutta modeller eğitme araçları sağlayarak bu süreci basitleştirir ve tüm makine öğrenimi operasyonları (MLOps) yaşam döngüsünü kolaylaştırır. OpenCV gibi kütüphaneler de görüntüleri ön işlemden geçirmek ve elde edilen maskeleri son işlemden geçirmek için bu modellerle birlikte sıklıkla kullanılır.