Sözlük

İki Aşamalı Nesne Dedektörleri

Karmaşık bilgisayarla görme görevlerinde hassas nesne algılama için doğruluk odaklı çözümler olan iki aşamalı nesne algılayıcıların gücünü keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

İki aşamalı nesne dedektörleri, bilgisayarla görmede (CV) algılama sürecini iki farklı aşamaya bölerek doğruluğa öncelik veren bir nesne alg ılama mimarisi kategorisini temsil eder. Bu dedektörler ilk olarak bir görüntüde nesnelerin bulunabileceği ilgi alanlarını (RoIs) tanımlamak ve ardından ikinci aşamada bu önerilen bölgelerdeki nesneleri sınıflandırmak ve konumlarını (sınırlayıcı kutular) hassaslaştırmak için tasarlanmıştır. Bu metodik yaklaşım, her bir potansiyel nesnenin daha ayrıntılı bir şekilde analiz edilmesini sağlar ve özellikle karmaşık senaryolarda veya küçük nesneleri tespit ederken genellikle daha yüksek algılama doğruluğuna yol açar.

İki Aşamalı Dedektörler Nasıl Çalışır?

İki aşamalı dedektörlerin çalışması, özellikle Evrişimsel Sinir Ağları (CNN'ler) olmak üzere derin öğrenme tekniklerinden yararlanan sıralı bir süreç içerir.

  1. Aşama 1: Bölge Önerisi: İlk aşamada tipik olarak, Faster R-CNN modeli tarafından popüler hale getirilen bir kavram olan Bölge Öneri Ağı (RPN) kullanılır. RPN görüntü özelliklerini tarar ( ResNet gibi bir omurga CNN tarafından çıkarılır) ve nesne içermesi muhtemel bir dizi aday bölge önerir. Bu öneriler esasen potansiyel nesnelerin etrafındaki kaba sınırlayıcı kutulardır.
  2. 2. Aşama: Sınıflandırma ve İyileştirme: Önerilen bölgeler (RoI'ler) daha sonra ikinci aşamaya geçirilir. Her bir RoI için özellikler çıkarılır (genellikle RoIPool veya RoIAlign gibi teknikler kullanılarak) ve bir sinir ağı (NN ) iki görevi yerine getirir: RoI içindeki nesneyi sınıflandırmak (örneğin, 'araba', 'kişi', 'arka plan') ve nesneye daha doğru bir şekilde uyması için sınırlayıcı kutunun koordinatlarını düzeltmek. Öne çıkan örnekler arasında R-CNN ailesi(R-CNN nedir?, Fast R-CNN, Faster R-CNN) ve bu yaklaşımı örnek segmentasyonu yapmak için genişleten Mask R-CNN yer almaktadır.

Avantajlar ve Dezavantajlar

İki aşamalı dedektörler farklı avantajlar sunmakla birlikte bazı dezavantajları da beraberinde getirir:

Avantajlar:

  • Yüksek Doğruluk: Teklif oluşturma ve sınıflandırma/incelemenin birbirinden ayrılması, daha odaklı işlemeye olanak tanıyarak, özellikle Ortalama Ortalama Kesinlik (mAP) gibi ölçütlerle ölçülen, genellikle daha yüksek doğrulukla sonuçlanır.
  • Daha İyi Lokalizasyon: İyileştirme aşaması genellikle daha hassas sınırlayıcı kutu tahminlerine yol açar.
  • Küçük Nesneler için Etkilidir: Odaklanmış ikinci aşama sayesinde bir görüntüdeki daha küçük nesneleri tanımlamada tek aşamalı dedektörlerden daha iyi performans gösterebilirler.

Dezavantajlar:

  • Daha Yavaş Hız: Sıralı iki aşamalı süreç doğası gereği daha fazla hesaplama süresi gerektirir ve bu da tek aşamalı yöntemlere kıyasla daha düşük çıkarım gecikmesine neden olur. Bu da onları gerçek zamanlı çıkarım gerektiren uygulamalar için daha az uygun hale getirir.
  • Karmaşıklık: Mimarinin uygulanması ve eğitilmesi genellikle daha karmaşıktır.
  • Daha Yüksek Hesaplama Maliyeti: Hem eğitim hem de çıkarım için genellikle daha fazla hesaplama kaynağı ( GPU'lar gibi) gerektirirler.

Tek Aşamalı Dedektörlerle Karşılaştırma

Temel ayrım mimari ve yaklaşımda yatmaktadır. Tek aşamalı nesne dedektörleri, örneğin Ultralytics YOLO serisi (örn, YOLOv8, YOLO11) ve SSD, ağ üzerinden tek bir geçişte nesne konumlandırma ve sınıflandırmayı aynı anda gerçekleştirir. Bu da onları önemli ölçüde daha hızlı hale getirir. Tek aşamalı ve iki aşamalı dedektörler arasındaki seçim genellikle bir değiş tokuş içerir: hıza (tek aşamalı) veya maksimum doğruluğa (iki aşamalı) öncelik vermek. Tek aşamalı dedektörler doğruluk farkını önemli ölçüde kapatmış olsa da, iki aşamalı dedektörler genellikle en yüksek hassasiyet gerektiren senaryolarda üstünlüklerini korumaktadır.

Gerçek Dünya Uygulamaları

İki aşamalı dedektörlerin yüksek doğruluğu, onları hassasiyetin çok önemli olduğu uygulamalarda değerli kılar:

  • Tıbbi Görüntü Analizi: Tanı için yüksek hassasiyetin kritik olduğu CT veya MRI taramalarında küçük tümörler veya lezyonlar gibi ince anomalilerin tespit edilmesi. Mask R-CNN gibi modeller Sağlık Hizmetlerinde Yapay Zeka alanında bu tür görevler için uyarlanmıştır (bkz. örnek: Tıbbi görüntülemede Mask R-CNN).
  • Otonom Sürüş: Otonom araçlardaki ayrıntılı algılama sistemlerinin, karmaşık veya zorlu ortamlarda bile yayalar, araçlar ve trafik işaretleri gibi çeşitli nesneleri doğru bir şekilde algılamasını ve sınıflandırmasını sağlayarak Otomotivde Yapay Zeka kapsamında genel güvenliğe katkıda bulunur.
  • Yüksek Çözünürlüklü Uydu Görüntüleri: Uydu görüntüsü analizinde belirli araç türlerinin veya altyapı değişikliklerinin izlenmesi gibi hassas nesne tanımlaması için ayrıntılı uydu görüntülerinin analiz edilmesi.
  • Üretimde Kalite Kontrol: Üretimde Yapay Zeka'da yüksek lokalizasyon doğruluğu gerektiren küçük kusurlar için ürünlerin incelenmesi. Meta AI tarafından geliştirilen Detectron2 gibi çerçeveler, popüler iki aşamalı modellerin uygulamalarını sağlar.
Tümünü okuyun