Yeşil çek
Panoya kopyalanan bağlantı

Örnek segmentasyonu nedir? Hızlı bir kılavuz

Örnek segmentasyonunun ne olduğuna, nasıl çalıştığına, çeşitli bilgisayarla görme uygulamalarında kullanımına ve yaratabileceği etkiye daha yakından bakarken bize katılın.

Bilgisayarla görme uygulamaları, yol koşullarını izleyen trafik kameralarından mağazalardaki self-checkout sistemlerine kadar günlük hayatımızda giderek daha yaygın hale geliyor. Makinelerin görsel verileri insanlara benzer bir şekilde anlamasını sağlayan Vision AI, bir dizi sektörde etki yaratıyor.

Bu uygulamaların çoğu, görüntülerdeki önemli nesnelerin etrafına sınırlayıcı kutular yerleştiren bir bilgisayarla görme görevi olan nesne algılamaya dayanır. Bu yaklaşım genellikle iyi çalışsa da, bazı görüntü analizi çözümleri daha da fazla hassasiyete ihtiyaç duyar.

Örneğin, tıbbi görüntüleme, bir tümörü tespit etmekten daha fazlasını gerektirir - tam şeklini belirlemek çok önemlidir. Benzer şekilde robotikte de makinelerin bir nesneyi doğru şekilde kavrayabilmesi için tam hatlarını tanıması gerekir. Bu zorlukların üstesinden gelmek için örnek segmentasyonu daha kesin bir çözüm sunar.

Örnek segmentasyonu, nesneleri tespit etmenin yeterli olmadığı kullanım durumlarını desteklemek için tasarlanmış bir bilgisayarla görme görevidir - piksel düzeyinde doğruluk sağlar. Bilgisayarla görme modelleri gibi Ultralytics YOLO11 görüntülere ve videolara kolayca örnek segmentasyonu uygulamak için kullanılabilir. 

Şekil 1. Örnek segmentasyonu için YOLO11 kullanımına örnek.

Bu kılavuzda, örnek segmentasyonunun nasıl çalıştığını, uygulamalarını ve Ultralytics YOLO11 'in belirli segmentasyon görevleri için nasıl özel olarak eğitilebileceğini açıklayacağız.

Örnek segmentasyonu nedir?

Diyelim ki birbirine yakın duran insanlardan oluşan bir grup fotoğrafı var. Nesne algılama, her bir kişinin etrafına kutular çizmenize yardımcı olabilir, ancak bu size tam şekillerini söylemez. 

Öte yandan örnek segmentasyonu, her bir kişinin etrafını dikkatlice çizmeye benzer, böylece üst üste gelseler bile tüm hatlarını görebilirsiniz. Bir şeyin nerede olduğunu sadece bir kutuyla işaretlemek yerine, piksel düzeyinde her nesnenin tam şeklini belirleyerek karmaşık görüntüleri anlamayı kolaylaştırır.

Sonuç, bir nesnenin şeklini dolduran ve tam olarak hangi piksellerin ona ait olduğunu belirleyen ayrıntılı bir maskedir. Bu hassasiyet seviyesi, nesnelerin tam şeklini ve sınırlarını anlamanın önemli olduğu birçok gerçek dünya uygulamasında kullanışlıdır.

Şekil 2. YOLO11'in örnek segmentasyonu desteğinin gösterilmesi.

Örnek segmentasyonu vs semantik segmentasyon

Örnek segmentasyonunu keşfederken, anlamsal segmentasyon kavramıyla karşılaşabilirsiniz.

Her iki teknik de bilgisayarların görüntüleri piksel düzeyinde anlamasına yardımcı olur, ancak farklı amaçlara hizmet ederler. Anlamsal segmentasyon her pikseli kategorisine göre etiketler ve aynı türdeki tüm nesneleri bir arada gruplandırır. Örneğin, birden fazla arabanın bulunduğu bir görüntüde, anlamsal segmentasyon araçları birbirinden ayırmadan hepsini "araba" olarak işaretleyecektir.

Örnek segmentasyonu ise her nesneyi ayrı ayrı tanımlayarak bunu bir adım öteye taşır. Tek tek örneklere benzersiz etiketler atar ve şekillerinin etrafında hassas maskeler oluşturur. Dolayısıyla aynı görüntüde, örnek segmentasyonu her şeyi "araba" olarak etiketlemekle kalmaz, her arabayı ayrı ayrı tanır ve ana hatlarını belirler.

İkisi arasındaki temel fark, semantik segmentasyonun nesneleri kategorilere göre gruplandırması, örnek segmentasyonun ise her nesneyi net sınırlara sahip benzersiz bir varlık olarak ayırt etmesidir. Hangi görevin kullanılacağını seçmek, belirli bir uygulamaya bağlıdır - bir görüntüde ne olduğunu bilmek yeterli mi yoksa tek tek nesneler arasında ayrım yapmak önemli mi?

Şekil 3. Örnek segmentasyonu ve semantik segmentasyon (sırasıyla sağ ve sol).

Popüler örnek segmentasyon modelleri

Günümüzde Vision AI topluluğu için çeşitli örnek segmentasyon modelleri mevcuttur. Bazıları daha hızlı, bazıları daha doğru ve bazılarının kullanımı daha kolay. 

Bu seçenekler yararlı olsa da, belirli bir görev için hangisinin kullanılacağı sorusuna yol açabilir? Seçenekler arasında Ultralytics YOLO modelleri, hız ve doğruluğa odaklandıkları için oldukça popülerdir. 

Ayrıca, bu modeller yıllar içinde önemli ölçüde gelişmiştir. Örneğin, Ultralytics YOLOv5PyTorch gibi çerçeveler kullanılarak basitleştirilmiş dağıtım, gelişmiş Vision AI'yı derin teknik uzmanlık gerektirmeden daha geniş bir kitle için erişilebilir hale getirir.

Bu başarının üzerine inşa ediyoruz, Ultralytics YOLOv8 örnek segmentasyonu, poz tahmini ve görüntü sınıflandırması gibi bilgisayarla görme görevleri için gelişmiş destek sundu. 

Şimdi, YOLO11 performansı yeni bir seviyeye taşıyor. COCO veri kümesinde YOLOv8m'den %22 daha az parametre ile daha yüksek bir ortalama ortalama hassasiyet (mAP) elde eder, yani daha az kaynak kullanırken nesneleri daha hassas bir şekilde tanıyabilir.

Şekil 4. YOLO11 kıyaslaması.

Basitçe ifade etmek gerekirse, YOLO11 verimlilikten ödün vermeden son teknoloji ürünü doğruluk sunar ve bu da onu sahada oyunun kurallarını değiştiren bir ürün haline getirir.

Örnek segmentasyonunun nasıl çalıştığını anlama

Daha sonra, örnek segmentasyonunun tipik olarak nasıl çalıştığını inceleyelim. Eski bilgisayarla görme modelleri iki aşamalı bir yaklaşım kullanır. 

İlk olarak, etraflarına sınırlayıcı kutular çizerek nesneleri tespit ederler. Ardından, her nesnenin tam şeklini belirlemek için piksel düzeyinde bir maske oluştururlar. İyi bilinen bir örnek, bir maske tahmin adımı ekleyerek nesne algılama modelleri üzerine inşa edilen Mask R-CNN'dir. Bu yöntem etkili olmakla birlikte, görüntüyü birden fazla aşamada işlediği için yavaş olabilir ve gerçek zamanlı uygulamaları daha zor hale getirir.

Bu arada, YOLO11 gibi modeller görüntüleri tek seferde işleyerek nesne sınırlayıcı kutularını ve örnek segmentasyon maskelerini aynı anda tahmin eder. Bu kolaylaştırılmış yaklaşım, yüksek doğruluğu korurken çok daha hızlı olmasını sağlar. Sonuç olarak, hem hızın hem de hassasiyetin çok önemli olduğu otonom sürüş, video analizi ve robotik gibi gerçek zamanlı uygulamalar için özellikle kullanışlıdır.

Örnek segmentasyonu için özel eğitim YOLO11

YOLO11 kutudan önceden eğitilmiş bir model olarak çıkmaktadır. Örnek segmentasyonu için günlük nesneleri kapsayan COCO-Seg veri kümesi üzerinde eğitilmiştir. Bununla birlikte, Ultralytics Python paketi, benzersiz nesnelerin segmente edilmesi gereken özel uygulamalar için gerekli olan özel eğitimi destekler.

Özel eğitim veya bir modele ince ayar yapmak neden önemlidir? Özel eğitim, önceden eğitilmiş modellerde zaten gömülü olan bilgi üzerine inşa ederek transfer öğrenmeden yararlanır. Sıfırdan başlamak yerine, mevcut bir modeli daha küçük veri kümeleri ve daha az bilgi işlem kaynağı kullanarak yeni görevlere uyarlar ve tüm bunları yaparken yüksek doğruluğu korur.

YOLO11 nasıl özel olarak eğitilir

İşte örnek segmentasyonu için YOLO11 'in ince ayarının yapılmasında yer alan adımlara daha yakından bir bakış: 

  • Veri hazırlama: Özel uygulamanıza göre görüntüleri toplayın ve açıklama ekleyin. Ultralytics birden fazla görüntü veri kümesi için destek sağlar, ancak görüntüleri ve ek açıklamaları gerekli YOLO biçiminde hazırlayarak kendi veri kümenizi kullanarak da eğitebilirsiniz.
  • Önceden eğitilmiş bir model kullanma: Sıfırdan başlamak yerine, önceden eğitilmiş bir Ultralytics YOLO11 modeli kullanın.
  • Model eğitimi: Yığın boyutu (yineleme başına işlenen görüntüler), görüntü boyutu (hedef girdi çözünürlüğü) ve epoklar (toplam eğitim döngüleri) gibi önemli eğitim ayarlarını yapın ve modeli eğitin.
  • Performans değerlendirmesi: Model eğitimi tamamlandıktan sonra, mAP gibi performans ölçümlerini kullanarak modelin doğruluğunu test edebilirsiniz. Ultralytics Python paketi ayrıca model değerlendirmesi için yerleşik işlevler sağlar.

YOLO11 tarafından etkinleştirilen örnek segmentasyon uygulamaları

Örnek segmentasyonu, makinelerin nesneleri daha doğru bir şekilde görmesine ve anlamasına yardımcı olarak gerçek dünyadaki zorlukları çözmek için kullanılabilir. Otomasyonun iyileştirilmesinden çevrenin korunmasına kadar birçok alanda önemli bir rol oynar. Etki yarattığı bazı örnekleri inceleyelim.

YOLO11 kullanarak şantiye güvenliği ve izleme

Örnek segmentasyonu, şantiyelerde güvenlik ve verimlilik sağlamanın kritik bir parçası olabilir. Örneğin, ağır makineleri izlemek için kullanılabilir. 

YOLO11 , vinçler, ekskavatörler ve buldozerler gibi farklı ekipman türlerini doğru bir şekilde segmentlere ayırmak ve tanımlamak ve konumlarını gerçek zamanlı olarak izlemek için ince ayar yapılabilir. Bu, saha yöneticilerinin makinelerin kesinlikle belirlenmiş alanlar içinde çalıştığından ve işçilerin bulunduğu veya tehlikelerin mevcut olduğu bölgelere tecavüz etmediğinden emin olmalarını sağlar. 

Ayrıca, bu tür çözümlerin gerçek zamanlı uyarı sistemleriyle entegre edilmesi, hızlı düzeltici önlemlerin alınmasını sağlar. Bunun ötesinde, toplanan bilgiler saha düzenini ve iş akışını optimize etmeye yardımcı olarak riskleri daha da azaltabilir ve üretkenliği artırabilir.

Şekil 5. YOLO11 kullanarak ağır makinelerin izlenmesi.

Segmentasyon ve YOLO11 ile hayvan izleme

Hayvan davranışlarının izlenmesi, araştırmacıların, çiftçilerin ve çevre koruma uzmanlarının farklı ortamlardaki hayvanlara daha iyi bakmalarına yardımcı olur. Örnek segmentasyonu, çiftliklerdeki, hayvanat bahçelerindeki ve doğal yaşam alanlarındaki hayvanları tek tek tanımlayarak ve segmentlere ayırarak bu sistemlerde yardımcı bir rol oynar. Sınırlayıcı kutular kullanan geleneksel nesne algılamanın aksine, örnek segmentasyonu her bir hayvanın piksel düzeyinde tanımlanmasını sağlar, bu da özellikle hayvanlar birbirine yakın olduğunda kullanışlıdır.

Ayrıntılı segmentasyon, hareketlerin ve davranışların daha doğru izlenmesini kolaylaştırır. Üst üste binen veya yakın kümelenen hayvanlar belirgin bir şekilde tanınabilir ve etkileşimlerin, sağlık değerlendirmelerinin ve faaliyet modellerinin daha hassas bir şekilde analiz edilmesini sağlar. Genel olarak, hayvan davranışlarına ilişkin daha derin bilgiler hayvan bakımı ve yönetimi uygulamalarını geliştirir.

Şekil 6. Örnek segmentasyonu kullanarak sığırların izlenmesi.

Spor analitiği ve oyuncu takibinde YOLO11

Hassas oyuncu ve etkinlik takibi, spor analizinin büyük bir parçasıdır. Geleneksel izleme yöntemleri manuel etiketlemeye dayanır ve bu da ayrıntılı etkileşimleri yakalayamayabilir. Bilgisayarlı görü, her bir oyuncu, top ve önemli olay gibi ayrıntıları piksel düzeyinde segmentlere ayırarak ayrıntılı içgörüler elde etmek için kullanılabilir.

Örneğin, örnek segmentasyonu, her bir oyuncuyu ve nesneyi net bir şekilde ayırarak fauller veya topsuz olaylar gibi olayların tespit edilmesine yardımcı olabilir. YOLO11 gibi modellerin sağladığı bu granüler izleme, analistlere hareket modellerini, uzamsal konumlandırmayı ve etkileşimleri yüksek doğrulukla incelemeleri için daha net bilgiler sunar. Bu içgörülerin önemli bir faydası, takımların stratejilerini iyileştirmelerine ve genel performansı artırmalarına yardımcı olmalarıdır.

Örnek segmentasyonunun artıları ve eksileri

İşte örnek segmentasyonunun çeşitli sektörlere sağlayabileceği temel faydalardan bazıları:

  • Geliştirilmiş otomasyon: Örnek segmentasyonu, kalite kontrol ve güvenlik izleme gibi görevleri otomatikleştirerek manuel müdahale ihtiyacını azaltır ve insan hatasını en aza indirir.
  • Daha iyi sahne anlayışı: Örnek segmentasyonu, her nesnenin ana hatlarını doğru bir şekilde belirleyerek karmaşık sahnelerin daha iyi anlaşılmasına katkıda bulunur ve daha bilinçli karar vermeyi destekler.
  • Verimli son işlem: Piksel düzeyinde çıktı, arka plan kaldırma, nesne sayma ve uzamsal analiz gibi görevleri basitleştirerek ek işlem adımlarına olan ihtiyacı azaltır.

Bu faydalar, örnek segmentasyonunun farklı kullanım durumlarını nasıl etkilediğini vurgularken, uygulamadaki zorlukları da göz önünde bulundurmak önemlidir. 

İşte örnek segmentasyonunun bazı temel sınırlamaları:

  • Şeffaflık ile ilgili zorluklar: Cam ve su gibi şeffaf veya yansıtıcı nesneleri bölümlere ayırmak zordur ve hatalı sınırlara yol açar.
  • Bakım masrafları: Modelleri doğru ve güncel tutmak için, çevresel koşullar ve veri setleri değiştikçe sürekli güncellemeler ve ince ayarlar gereklidir.
  • Yüksek ek açıklama çabası: Örnek segmentasyon modellerinin eğitimi için piksel düzeyinde ayrıntılı ek açıklamalar gerekir; bu da veri hazırlama süresini ve maliyetini önemli ölçüde artırır.

Önemli çıkarımlar

Örnek segmentasyonu, üst üste gelseler bile tek tek nesneleri hassas bir şekilde ayırt etmeyi mümkün kılar. Nesne sınırlarını piksel düzeyinde yakalayarak, nesne algılama gibi geleneksel bilgisayarla görme görevlerine kıyasla görsel verilerin daha derin bir şekilde anlaşılmasını sağlar.

Bilgisayarlı görü alanındaki son gelişmeler, örnek segmentasyonunu daha hızlı ve kullanımı daha kolay hale getirmiştir. Özellikle Ultralytics YOLO11 gibi bilgisayarlı görü modelleri, süreci basitleştirerek minimum kurulumla gerçek zamanlı segmentasyon sağlar ve çeşitli endüstriler ve uygulamalar için daha erişilebilir hale getirir.

Yapay zekayı merak mı ediyorsunuz? Keşfetmeye devam etmek için GitHub depomuzu ziyaret edin ve topluluğumuzla bağlantı kurun. Çözüm sayfalarımızda sürücüsüz araçlarda yapay zeka ve tarımda yapay zeka gibi yenilikler hakkında bilgi edinin. Lisanslama seçeneklerimize göz atın ve bir bilgisayarla görme projesine başlayın!

Facebook logosuTwitter logosuLinkedIn logosuKopya-bağlantı sembolü

Bu kategoride daha fazlasını okuyun

Yapay zekanın gelecekteki
adresini birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın