Sözlük

Görüntü Segmentasyonu

Ultralytics YOLO ile görüntü segmentasyonunun gücünü keşfedin. Piksel düzeyinde hassasiyeti, türleri, uygulamaları ve gerçek dünyadaki yapay zeka kullanım örneklerini keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Görüntü segmentasyonu, dijital bir görüntünün birden fazla farklı bölgeye veya segmente bölünmesini içeren bilgisayarla görmede (CV) temel bir tekniktir. Birincil amaç, görüntüdeki her piksele bir sınıf etiketi atamak, esasen görüntü temsilini daha anlamlı ve makinelerin analiz etmesi için daha kolay bir şeye basitleştirmektir. Dikdörtgen sınırlayıcı kutular kullanarak nesneleri tanımlayan nesne algılamanın aksine, görüntü segmentasyonu, nesnelerin tam şeklini özetleyerek görüntü içeriğinin çok daha ayrıntılı, piksel düzeyinde anlaşılmasını sağlar. Bu hassasiyet, ayrıntılı uzamsal farkındalık gerektiren görevler için çok önemlidir.

Görüntü Segmentasyonu Nasıl Çalışır?

Görüntü segmentasyon algoritmaları, bir görüntüyü piksel piksel inceleyerek ve renk, yoğunluk, doku veya uzamsal konum gibi belirli özellikleri paylaşan pikselleri segmentler halinde gruplandırarak çalışır. İlk yöntemler eşikleme, bölge büyütme ve kümeleme(K-Means, DBSCAN) gibi tekniklere dayanıyordu. Ancak modern yaklaşımlar derin öğrenmeden (DL), özellikle de Evrişimsel Sinir Ağlarından (CNN'ler) büyük ölçüde yararlanmaktadır. Bu sinir ağları, piksel bazında sınıflandırma yapmak için karmaşık hiyerarşik özellikleri doğrudan eğitim verilerinden öğrenir. Tipik çıktı, her pikselin değerinin ait olduğu sınıf etiketine karşılık geldiği ve nesnelerin veya bölgelerin kesin sınırlarını görsel olarak vurgulayan bir görüntü olan segmentasyon maskesidir. Gibi çerçeveler PyTorch ve TensorFlow bu modelleri oluşturmak ve eğitmek için yaygın olarak kullanılır.

Görüntü Segmentasyon Türleri

Görüntü bölütleme görevleri, nesnelerin ve sınıfların nasıl ele alındığına bağlı olarak değişebilir:

  • Anlamsal Segmentasyon: Her pikseli önceden tanımlanmış bir kategoriye atar (örneğin, 'araba', 'yol', 'gökyüzü'). Aynı nesne sınıfının farklı örnekleri arasında ayrım yapmaz. Örneğin tüm arabalar aynı etiketi paylaşacaktır.
  • Örnek Segmentasyonu: Bir görüntü içindeki her bir nesne örneğini tanımlayarak ve tanımlayarak semantik segmentasyondan bir adım daha ileri gider. Aynı sınıfa ait olsalar bile her ayrı araç benzersiz bir tanımlayıcı veya maske alır. Bu, özellikle tek tek nesnelerin sayılması veya izlenmesi gerektiğinde kullanışlıdır.
  • Panoptik Segmentasyon: Anlamsal ve örnek segmentasyonunu birleştirir. Her piksele bir sınıf etiketi atar (semantik segmentasyon gibi) ve her nesne örneğini benzersiz bir şekilde tanımlar (örnek segmentasyonu gibi). Sahnenin kapsamlı ve birleşik bir şekilde anlaşılmasını sağlar.

Görüntü Segmentasyonunu İlgili Terimlerden Ayırt Etme

  • Görüntü Segmentasyonu ve Nesne Algılama: Nesne algılama, nesnelerin etrafına konumlarını ve sınıflarını gösteren sınırlayıcı kutular çizer. Görüntü segmentasyonu, her nesnenin veya bölgenin tam şeklini özetleyen piksel düzeyinde bir maske sağlayarak basit bir kutudan daha fazla ayrıntı sunar.
  • Görüntü Segmentasyonu ve Görüntü Sınıflandırması: Görüntü sınıflandırma tüm görüntüye tek bir etiket atar (örneğin, 'kedi içerir'). Görüntü segmentasyonu, görüntü içindeki her piksele bir etiket atayarak birden fazla nesneyi veya bölgeyi ve bunların şekillerini tanımlar.
  • Görüntü Segmentasyonu ve Görüntü Tanıma: Görüntü tanıma, yapay zekanın görüntülerdeki nesneleri, insanları, yerleri vb. tanımladığı görevler için kullanılan daha geniş bir terimdir. Görüntü segmentasyonu, piksel düzeyinde bölümlemeye odaklanan belirli bir görüntü tanıma türüdür.

Gerçek Dünya Uygulamaları

Görüntü segmentasyonunun sağladığı detaylı analiz çok sayıda uygulamaya olanak tanır:

  • Tıbbi Görüntü Analizi: Segmentasyon, BT taramalarında, MRI'larda ve X-ışınlarında tümörleri, organları veya anomalileri tanımlamak ve ana hatlarını belirlemek için kritik öneme sahiptir. Örneğin, Ultralytics YOLO modelleri tümörleri hassas bir şekilde segmente edebilir, etkilenen alanların tam boyutunu ve şeklini ölçerek tanı ve tedavi planlamasında radyologlara yardımcı olabilir, bu da genellikle sadece bir sınırlayıcı kutu ile varlıklarını tespit etmekten daha bilgilendiricidir. Çeşitli tıbbi görüntüleme teknikleri bu ayrıntı düzeyinden önemli ölçüde faydalanır.
  • Otonom Araçlar: Kendi kendine giden otomobiller, çevrelerini ayrıntılı bir düzeyde anlamak için büyük ölçüde segmentasyona güvenir. Örneğin, yolu, şerit işaretlerini, yayaları, diğer araçları ve engelleri bölümlere ayırmak aracın güvenli bir şekilde seyretmesini sağlar. Sürülebilir alanın (yol segmentasyonu) ve sürülebilir olmayan alanların (kaldırımlar, bariyerler) tam olarak bilinmesi, yol planlaması ve daha yüksek sürüş otomasyonu seviyelerine ulaşmak için çok önemlidir.
  • Uydu Görüntüsü Analizi: Arazi örtüsü sınıflandırması (ormanların, su kütlelerinin, kentsel alanların tanımlanması), ormansızlaşmanın izlenmesi ve mahsul izleme(tarımda yapay zeka) gibi tarımsal uygulamalar için kullanılır.
  • Üretim: Montaj hatlarında kusurları tespit etmek veya kalite denetimi yapmak.
  • Perakende: Raf düzenlerini analiz etme veya envanteri izleme.

Görüntü Segmentasyonu ve Ultralytics YOLO

Ultralytics YOLO gibi modeller YOLOv8 ve YOLO11gerçek zamanlı çıkarım için hız ve doğruluğu dengeleyerek örnek segmentasyon görevleri için son teknoloji performans sağlar. Ultralytics çerçevesi, COCO gibi veri kümeleri veya araba parçaları veya çatlak segmentasyonu gibi özel veri kümeleri üzerinde özel segmentasyon modellerini eğitme sürecini basitleştirir. Ultralytics HUB gibi araçlar, veri kümelerini yönetmek, modelleri eğitmek(bulut eğitimi mevcuttur) ve bunları dağıtmak için kolaylaştırılmış bir platform sunar. Uygulama ayrıntıları için segmentasyon görevi belgelerini inceleyebilir veya Google Colab'da önceden eğitilmiş YOLOv8 modelleriyle segmentasyon veya YOLO11 ile görüntü segmentasyonu gibi kılavuzları takip edebilirsiniz.

Tümünü okuyun