Sözlük

İki Aşamalı Nesne Dedektörleri

Karmaşık bilgisayarla görme görevlerinde hassas nesne algılama için doğruluk odaklı çözümler olan iki aşamalı nesne algılayıcıların gücünü keşfedin.

İki aşamalı nesne dedektörleri, bir görüntü veya videodaki nesneleri sıralı, iki aşamalı bir işlemle tanımlayan ve konumlandıran bir bilgisayarla görme modelleri sınıfıdır. Bu metodoloji, özellikle nesneleri tam olarak konumlandırmada yüksek doğruluğu ile bilinir, ancak genellikle daha yüksek çıkarım gecikmesi pahasına gelir. Temel fikir, önce potansiyel ilgi alanlarını belirlemek ve ardından yalnızca bu umut verici bölgeler üzerinde ayrıntılı sınıflandırma ve yerelleştirme gerçekleştirmektir.

İki Aşamalı Süreç

İki aşamalı bir dedektörün çalışması farklı, sıralı aşamalara ayrılır:

  1. Bölge Önerisi Oluşturma: İlk aşamada model, bir nesne içermesi muhtemel "ilgi bölgeleri" (RoI'ler) veya teklifler olarak bilinen bir dizi aday bölge oluşturmak için görüntüyü tarar. Bu işlem tipik olarak Faster R-CNN mimarisinde meşhur olduğu üzere Bölge Öneri Ağı (RPN) adı verilen bir alt modül tarafından gerçekleştirilir. Bu aşamanın amacı nesneleri sınıflandırmak değil, sadece ikinci aşamanın analiz etmesi gereken konum sayısını azaltmaktır.

  2. Nesne Sınıflandırması ve Sınırlayıcı Kutu İyileştirmesi: İkinci aşamada, önerilen her bölge bir sınıflandırma başlığına ve bir regresyon başlığına iletilir. Sınıflandırma kafası, RoI içindeki nesnenin sınıfını belirler (örneğin, "kişi", "araba", "köpek") veya arka plan olarak belirler. Aynı zamanda regresyon kafası, nesneye daha doğru bir şekilde uyması için sınırlayıcı kutunun koordinatlarını iyileştirir. Önceden seçilmiş bölgelerin bu odaklanmış analizi, modelin yüksek lokalizasyon hassasiyetine ulaşmasını sağlar.

İki Aşamalı ve Tek Aşamalı Dedektörler

Birincil ayrım operasyonel işlem hatlarında yatmaktadır. İki aşamalı dedektörler konum belirleme ve sınıflandırma görevlerini birbirinden ayırırken, tek aşamalı nesne dedektörleri her iki görevi de aynı anda tek bir geçişte gerçekleştirir.

  • İki Aşamalı Dedektörler (örn. R-CNN ailesi): Doğruluğa öncelik verin. İki aşamalı süreç, her potansiyel nesne için daha ayrıntılı özellik çıkarma ve iyileştirme sağlar, bu da birçok küçük veya üst üste binen nesneye sahip karmaşık sahnelerde daha iyi performans sağlar. Bununla birlikte, karmaşıklıkları onları hesaplama açısından yoğun ve daha yavaş hale getirir.
  • Tek Aşamalı Dedektörler (örn. Ultralytics YOLO, SSD): Hız ve verimliliğe öncelik verir. Nesne algılamayı tek bir regresyon problemi olarak ele alarak, uç yapay zeka cihazlarındaki uygulamalar için uygun gerçek zamanlı çıkarım hızlarına ulaşırlar. YOLO11 gibi modern tek aşamalı modeller doğruluk açığını önemli ölçüde kapatmış olsa da, mümkün olan en yüksek hassasiyeti gerektiren görevler için iki aşamalı dedektörler hala tercih edilebilir.

Öne Çıkan Mimariler

İki aşamalı dedektörlerin evrimi birkaç etkili model tarafından belirlenmiştir:

  • R-CNN (Bölge Tabanlı Evrişimsel Sinir Ağı): Bölge önerilerini bir konvolüsyonel sinir ağı (CNN) ile kullanmayı ilk öneren öncü model. Öneriler oluşturmak için Seçici Arama adı verilen harici bir algoritma kullanmıştır.
  • Hızlı R-CNN: Tüm görüntüyü bir CNN aracılığıyla bir kez işleyerek hesaplamayı paylaşan ve süreci önemli ölçüde hızlandıran bir iyileştirme.
  • Daha hızlı R-CNN: Uçtan uca bir derin öğrenme çözümü için bölge önerme mekanizmasını sinir ağının kendisine entegre eden Bölge Önerme Ağı (RPN) tanıtıldı.
  • Maske R-CNN: Her nesne için piksel düzeyinde bir maske çıkaran üçüncü bir dal ekleyerek Faster R-CNN'yi genişletir ve örnek segmentasyonunu mümkün kılar.

Gerçek Dünya Uygulamaları

İki aşamalı dedektörlerin yüksek doğruluğu, onları hassasiyetin çok önemli olduğu senaryolarda değerli kılar:

  • Tıbbi Görüntü Analizi: Tıbbi taramalarda (CT, MRI) küçük tümörler, lezyonlar veya polipler gibi ince anomalileri tespit etmek, tanıya yardımcı olmak için yüksek doğruluk gerektirir. Hassas lokalizasyon, tedavi planlaması için kritik öneme sahiptir. Sağlık hizmetlerinde yapay zeka ve Radiology gibi dergilerdeki araştırmalar hakkında daha fazla bilgi edinin : Yapay Zeka. İlgili görevler için Beyin Tümörü veri kümesi gibi veri kümelerini keşfedebilirsiniz.
  • Otonom Sürüş: Yayaları, bisikletlileri, diğer araçları ve trafik işaretlerini, özellikle de küçük veya kısmen kapalı olanları doğru bir şekilde tespit etmek ve yerlerini belirlemek, sürücüsüz araçların güvenlik sistemleri için çok önemlidir. Waymo gibi şirketler güçlü algılama sistemlerine büyük ölçüde güveniyor.
  • Ayrıntılı Sahne Anlayışı: Nesne etkileşimlerinin veya hassas sayımın ayrıntılı bir şekilde anlaşılmasını gerektiren uygulamalar daha yüksek doğruluktan yararlanır.
  • Üretimde Kalite Kontrol: Küçük kusurları belirlemek veya karmaşık montajlarda bileşen yerleşimini doğrulamak genellikle yüksek hassasiyet gerektirir. Üretimde yapay zeka hakkında daha fazla bilgi edinin.

Bu modellerin eğitimi genellikle COCO veri kümesi gibi büyük etiketli veri kümelerini ve dikkatli ayarlamayı içerir. Ultralytics, model eğitimi ve performans metriklerini anlamak için kaynaklar sağlar. Ultralytics, Ultralytics YOLO gibi verimli tek aşamalı modellere odaklanırken, iki aşamalı dedektörleri anlamak, daha geniş nesne algılama alanı içinde değerli bir bağlam sağlar.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve büyüyün

Şimdi katılın
Panoya kopyalanan bağlantı