İki aşamalı nesne dedektörlerinin bölge önerileri, sınıflandırma ve sınırlayıcı kutu iyileştirme ile nesne algılamada nasıl yüksek doğruluk elde ettiğini öğrenin.
İki aşamalı nesne algılayıcıları, bilgisayarla görmede algılama işlemini iki farklı adımda gerçekleştiren bir nesne algılama modeli kategorisidir. Başlangıçta bu modeller, görüntüde nesnelerin bulunabileceği potansiyel alanlar olan bir dizi bölge önerisi oluşturur. Daha sonra, önerilen her bölgeyi sınıflandırır ve nesneleri doğru bir şekilde tanımlamak ve konumlandırmak için sınırlayıcı kutu koordinatlarını hassaslaştırırlar. Bu iki aşamalı yaklaşım, özellikle nesnelerin ölçek, yön ve görünüm açısından farklılık gösterebileceği karmaşık senaryolarda nesne algılama görevlerinde daha yüksek doğruluk sağlar.
İki aşamalı nesne dedektörlerinin çalışması iki ana aşamaya ayrılabilir: bölge önerme ve bölge sınıflandırma.
Bölge Önerisi: İlk aşamada, model bir görüntü içindeki potansiyel nesne konumlarını tanımlar. Bu genellikle Seçici Arama gibi algoritmalar veya daha yakın zamanda Bölge Öneri Ağları (RPN'ler) kullanılarak gerçekleştirilir. RPN'ler, nesne içermesi muhtemel alanları belirlemek için görüntüyü tarayan ve bu alanların etrafında sınırlayıcı kutular oluşturan bir sinir ağı türüdür.
Bölge Sınıflandırması: İkinci aşama, önerilen bölgelerdeki nesnelerin sınıflandırılmasını ve daha hassas bir uyum için sınırlayıcı kutuların ayarlanmasını içerir. Önerilen her bölge, daha sonra nesneyi sınıflandırmak ve sınırlayıcı kutu koordinatlarını hassaslaştırmak için kullanılan özellikleri çıkarmak için bir konvolüsyonel sinir ağından (CNN) geçirilir. Bu aşama, tespit edilen her nesnenin doğru bir şekilde etiketlenmesini ve görüntü içinde konumlandırılmasını sağlar.
Birkaç temel bileşen ve teknik, iki aşamalı nesne dedektörlerinin işleyişinin ayrılmaz bir parçasıdır:
Bölge Teklif Ağları (RPN'ler): RPN'ler, yüksek kaliteli bölge önerilerini verimli bir şekilde oluşturmak için çok önemlidir. Küçük bir ağı bir CNN'in özellik haritası çıktısı üzerinde kaydırarak, her konumda bir nesnenin bulunma olasılığını tahmin ederek ve sınırlayıcı kutu ayarlamaları önererek çalışırlar.
Özellik Çıkarma: Özellik çıkarma, önerilen bölgelerden anlamlı özellikler çıkarmak için ResNet veya VGG gibi bir CNN kullanılmasını içerir. Bu özellikler, sonraki sınıflandırma ve sınırlayıcı kutu regresyon görevleri için gereklidir.
Sınırlayıcı Kutu Regresyonu: Nesneyi önerilen bir bölge içinde sınıflandırdıktan sonra, sınırlayıcı kutu regresyonu, sınırlayıcı kutu koordinatlarına ince ayar yapmak için kullanılır ve tespit edilen nesnenin etrafına sıkı bir uyum sağlar.
İki aşamalı nesne dedektörleri genellikle Ultralytics YOLO (You Only Look Once) gibi tek aşamalı nesne dedektörleriyle karşılaştırılır. Tek aşamalı dedektörler nesne tespitini ağ üzerinden tek bir geçişte gerçekleştirerek onları daha hızlı ve gerçek zamanlı uygulamalar için daha uygun hale getirirken, iki aşamalı dedektörler iki aşamalı süreçleri nedeniyle genellikle daha yüksek doğruluk sunar.
Doğruluk: İki aşamalı dedektörler tipik olarak daha yüksek doğruluk elde eder çünkü ikinci aşama, önerilen her bölgenin ayrıntılı analizine ve iyileştirilmesine olanak tanır. Bu, özellikle üst üste binen nesnelerin veya karmaşık arka planların olduğu senaryolarda faydalıdır.
Hız: Tek aşamalı dedektörler gibi Ultralytics YOLO daha hızlıdır çünkü tüm görüntüyü tek bir ileri geçişte işlerler. İki aşamalı dedektörler, daha doğru olmakla birlikte, her bölge önerisini ayrı ayrı işleme ek adımı nedeniyle daha yavaştır.
İki aşamalı nesne dedektörleri, yüksek doğruluğun çok önemli olduğu çeşitli gerçek dünya uygulamalarında kullanılır:
Otonom Araçlar: Sürücüsüz araçlarda yayaların, araçların ve diğer nesnelerin doğru algılanması güvenli navigasyon için kritik öneme sahiptir. İki aşamalı dedektörler, tüm potansiyel tehlikelerin doğru bir şekilde tanımlanmasını ve lokalize edilmesini sağlamaya yardımcı olur. Kendi kendine sürüş teknolojisinde yapay zeka kullanımı hakkında daha fazla bilgi edinin.
Tıbbi Görüntüleme: Sağlık hizmetlerinde iki aşamalı dedektörler, tümör veya kırık gibi anomalileri tespit etmek amacıyla X-ışınları ve MRI taramaları gibi tıbbi görüntüleri analiz etmek için kullanılır. Bu dedektörlerin yüksek doğruluğu, güvenilir teşhis ve tedavi planlaması için çok önemlidir. Yapay zeka ve radyoloji hakkında daha fazlasını keşfedin.
İki aşamalı tespit çerçevesine dayanan çeşitli etkili modeller geliştirilmiştir:
R-CNN (CNN özellikli bölgeler): Bu kategorideki öncü modellerden biri olan R-CNN, bölge önerileri oluşturmak için Seçici Arama ve her bölgeyi sınıflandırmak için bir CNN kullanır.
Hızlı R-CNN: R-CNN üzerinde bir iyileştirme olan Hızlı R-CNN, tüm görüntüyü CNN aracılığıyla bir kez işler ve ardından her bölge önerisi için özellikleri çıkararak süreci önemli ölçüde hızlandırır.
Daha hızlı R-CNN: Bu model, bölge önerisi oluşturmayı algılama ağıyla entegre ederek hem hızı hem de doğruluğu daha da artıran Bölge Önerisi Ağı'nı (RPN) sunar.
Belirli nesne algılama mimarileri hakkında daha fazla ayrıntı için nesne algılama hakkındaki Wikipedia sayfası gibi kaynaklara başvurabilirsiniz.