Ultralytics YOLO ile görüntü segmentasyonunun gücünü keşfedin. Piksel düzeyinde hassasiyeti, türleri, uygulamaları ve gerçek dünyadaki yapay zeka kullanım örneklerini keşfedin.
Görüntü segmentasyonu, dijital bir görüntünün birden fazla farklı bölgeye veya segmente bölünmesini içeren bilgisayarla görmede (CV) temel bir tekniktir. Birincil amaç, görüntüdeki her piksele bir sınıf etiketi atamak, esasen görüntü temsilini daha anlamlı ve makinelerin analiz etmesi için daha kolay bir şeye basitleştirmektir. Dikdörtgen sınırlayıcı kutular kullanarak nesneleri tanımlayan nesne algılamanın aksine, görüntü segmentasyonu, nesnelerin tam şeklini özetleyerek görüntü içeriğinin çok daha ayrıntılı, piksel düzeyinde anlaşılmasını sağlar. Bu hassasiyet, ayrıntılı uzamsal farkındalık gerektiren görevler için çok önemlidir.
Görüntü segmentasyon algoritmaları, bir görüntüyü piksel piksel inceleyerek ve renk, yoğunluk, doku veya uzamsal konum gibi belirli özellikleri paylaşan pikselleri segmentler halinde gruplandırarak çalışır. İlk yöntemler eşikleme, bölge büyütme ve kümeleme(K-Means, DBSCAN) gibi tekniklere dayanıyordu. Ancak modern yaklaşımlar derin öğrenmeden (DL), özellikle de Evrişimsel Sinir Ağlarından (CNN'ler) büyük ölçüde yararlanmaktadır. Bu sinir ağları, piksel bazında sınıflandırma yapmak için karmaşık hiyerarşik özellikleri doğrudan eğitim verilerinden öğrenir. Tipik çıktı, her pikselin değerinin ait olduğu sınıf etiketine karşılık geldiği ve nesnelerin veya bölgelerin kesin sınırlarını görsel olarak vurgulayan bir görüntü olan segmentasyon maskesidir. Gibi çerçeveler PyTorch ve TensorFlow bu modelleri oluşturmak ve eğitmek için yaygın olarak kullanılır.
Görüntü bölütleme görevleri, nesnelerin ve sınıfların nasıl ele alındığına bağlı olarak değişebilir:
Görüntü segmentasyonunun sağladığı detaylı analiz çok sayıda uygulamaya olanak tanır:
Ultralytics YOLO gibi modeller YOLOv8 ve YOLO11gerçek zamanlı çıkarım için hız ve doğruluğu dengeleyerek örnek segmentasyon görevleri için son teknoloji performans sağlar. Ultralytics çerçevesi, COCO gibi veri kümeleri veya araba parçaları veya çatlak segmentasyonu gibi özel veri kümeleri üzerinde özel segmentasyon modellerini eğitme sürecini basitleştirir. Ultralytics HUB gibi araçlar, veri kümelerini yönetmek, modelleri eğitmek(bulut eğitimi mevcuttur) ve bunları dağıtmak için kolaylaştırılmış bir platform sunar. Uygulama ayrıntıları için segmentasyon görevi belgelerini inceleyebilir veya Google Colab'da önceden eğitilmiş YOLOv8 modelleriyle segmentasyon veya YOLO11 ile görüntü segmentasyonu gibi kılavuzları takip edebilirsiniz.