Anchor tabanlı dedektörlerin nesne algılama için önceden tanımlanmış sınırlayıcı kutuları nasıl kullandığını keşfedin. Temel mekanizmalarını, gerçek hayattaki kullanım örneklerini ve modern, daha hızlı Ultralytics ile karşılaştırıldığında nasıl olduklarını öğrenin.
Anchor tabanlı dedektörler, bilgisayar görüşünde classify yerelleştirmek ve classify için önceden tanımlanmış bir dizi sınırlayıcı kutu kullanan nesne algılama modellerinin temel sınıfıdır. Bu sistemler, bir nesnenin koordinatlarını sıfırdan tahmin etmeye çalışmak yerine, anchor kutuları olarak bilinen sabit referans şablonlarıyla başlar. Anchor kutuları, classify Ardından, sinir ağı, bu şablonlardan hangisinin görüntüdeki bir nesneye en iyi şekilde uyduğunu belirlemek ve çapayı hedefle mükemmel bir şekilde hizalamak için gereken belirli ofsetleri (konum ve boyut ayarlamaları) hesaplamak üzere eğitilir. Bu yaklaşım, Bu yaklaşım, keyfi koordinat tahmininin zorluğunu daha istikrarlı bir regresyon görevine dönüştürür ve bu, Faster R-CNN ve SSD gibi erken dönem derin öğrenme (DL) mimarilerinin gelişiminde önemli bir atılım olmuştur.
Ankraj tabanlı bir dedektörün temel işlevi, girdi görüntüsünü yoğun bir ızgaraya bölmektir. Bu ızgaranın her bir hücresinde, model, uzun boylu yayalar veya geniş araçlar gibi farklı nesne şekillerini hesaba katmak için değişen ölçeklere ve en boy oranlarına sahip birden fazla ankraj kutusu oluşturur. Görüntü verileri modelin omurgasından geçerken backbone, ağ zengin özellikleri çıkararak iki görevi aynı anda yerine getirir:
x, y koordinatlar, genişlik ve yükseklik, sıkı bir sonuç verir
sınırlayıcı kutu.
Model eğitimi sırasında, bu dedektörler Birleşim Üzerine Kesişim (IoU) adlı bir metrik kullanarak önceden tanımlanmış bağlantıları veri setinde sağlanan gerçek etiketlerle eşleştirir. Yüksek örtüşme oranına sahip bağlantı noktaları pozitif örnekler olarak değerlendirilir. Bu süreç binlerce potansiyel algılama ürettiğinden, Non-Maximum Suppression (NMS) olarak bilinen bir filtreleme algoritması çıkarım sırasında uygulanarak gereksiz kutular ortadan kaldırılır ve her nesne için yalnızca en doğru tahminler korunur.
Yıllar boyunca çapa tabanlı yöntemler standart olarak kabul edilirken, bu alan çapasız dedektörlere doğru evrimleşmiştir. Bu ayrımı anlamak, modern uygulayıcılar için hayati önem taşımaktadır.
Çapa tabanlı mantık, nesne şekillerinin öngörülebilir ve tutarlı olduğu birçok eski ve özel üretim sisteminde hala geçerlidir .
En son YOLO26 modelleri üstün performans için çapa içermeyen kafalar kullanırken, algılama çalıştırma arayüzü tutarlı kalmaktadır. Ultralytics ve Python , bir modelin çapa mı yoksa merkez noktası mı kullandığı konusundaki karmaşıklığı ortadan kaldırarak, kullanıcıların sonuçlara odaklanmalarını sağlar.
Aşağıda, bir modeli yükleme ve detect için çıkarım yapma işlemi anlatılmaktadır. Bu iş akışı, temel bağlantı mimarisinden bağımsız olarak uygulanır:
from ultralytics import YOLO
# Load the YOLO26 model (optimized for speed and accuracy)
model = YOLO("yolo26n.pt")
# Run inference on an image source
# The model handles internal logic (anchor-based or anchor-free) automatically
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Display the first result with bounding boxes
results[0].show()
Algılama mekanizmalarına ilişkin anlayışınızı derinleştirmek için, Bölge Öneri Ağı'nı (RPN) tanıtan Faster R-CNN hakkındaki temel araştırmaları inceleyin veya hız için çapa tabanlı algılamayı optimize eden Tek Atışlı Çoklu Kutu Algılayıcı (SSD) hakkında bilgi edinin. Bu alana daha geniş bir bakış açısı için, COCO , hem çapa tabanlı hem de çapa tabanlı olmayan modelleri değerlendirmek için standart bir kriter görevi görür. Ayrıca, Coursera'daki ileri düzey kurslar genellikle kutu regresyonu ve çapa eşleştirmesinin matematiksel ayrıntılarını ele alır.