Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Çapa Tabanlı Tespit Ediciler

Anchor tabanlı dedektörlerin nesne algılama için önceden tanımlanmış sınırlayıcı kutuları nasıl kullandığını keşfedin. Temel mekanizmalarını, gerçek hayattaki kullanım örneklerini ve modern, daha hızlı Ultralytics ile karşılaştırıldığında nasıl olduklarını öğrenin.

Anchor tabanlı dedektörler, bilgisayar görüşünde classify yerelleştirmek ve classify için önceden tanımlanmış bir dizi sınırlayıcı kutu kullanan nesne algılama modellerinin temel sınıfıdır. Bu sistemler, bir nesnenin koordinatlarını sıfırdan tahmin etmeye çalışmak yerine, anchor kutuları olarak bilinen sabit referans şablonlarıyla başlar. Anchor kutuları, classify Ardından, sinir ağı, bu şablonlardan hangisinin görüntüdeki bir nesneye en iyi şekilde uyduğunu belirlemek ve çapayı hedefle mükemmel bir şekilde hizalamak için gereken belirli ofsetleri (konum ve boyut ayarlamaları) hesaplamak üzere eğitilir. Bu yaklaşım, Bu yaklaşım, keyfi koordinat tahmininin zorluğunu daha istikrarlı bir regresyon görevine dönüştürür ve bu, Faster R-CNN ve SSD gibi erken dönem derin öğrenme (DL) mimarilerinin gelişiminde önemli bir atılım olmuştur.

Çapa Tabanlı Mekanizmalar Nasıl Çalışır?

Ankraj tabanlı bir dedektörün temel işlevi, girdi görüntüsünü yoğun bir ızgaraya bölmektir. Bu ızgaranın her bir hücresinde, model, uzun boylu yayalar veya geniş araçlar gibi farklı nesne şekillerini hesaba katmak için değişen ölçeklere ve en boy oranlarına sahip birden fazla ankraj kutusu oluşturur. Görüntü verileri modelin omurgasından geçerken backbone, ağ zengin özellikleri çıkararak iki görevi aynı anda yerine getirir:

  1. Sınıflandırma: Model, her bir bağlantıya bir olasılık puanı atayarak, bağlantının belirli bir nesne sınıfını (örneğin, "araba", "köpek") içerip içermediğini veya sadece arka plan gürültüsü olup olmadığını tahmin eder.
  2. Kutu Regresyonu: Bir nesne içerdiği tespit edilen bağlantılar için, ağ düzeltme faktörlerini tahmin ederek bağlantının merkezini iyileştirir. . x, y koordinatlar, genişlik ve yükseklik, sıkı bir sonuç verir sınırlayıcı kutu.

Model eğitimi sırasında, bu dedektörler Birleşim Üzerine Kesişim (IoU) adlı bir metrik kullanarak önceden tanımlanmış bağlantıları veri setinde sağlanan gerçek etiketlerle eşleştirir. Yüksek örtüşme oranına sahip bağlantı noktaları pozitif örnekler olarak değerlendirilir. Bu süreç binlerce potansiyel algılama ürettiğinden, Non-Maximum Suppression (NMS) olarak bilinen bir filtreleme algoritması çıkarım sırasında uygulanarak gereksiz kutular ortadan kaldırılır ve her nesne için yalnızca en doğru tahminler korunur.

Ankarsız Dedektörlerle Karşılaştırma

Yıllar boyunca çapa tabanlı yöntemler standart olarak kabul edilirken, bu alan çapasız dedektörlere doğru evrimleşmiştir. Bu ayrımı anlamak, modern uygulayıcılar için hayati önem taşımaktadır.

  • Anchor Tabanlı: YOLOv5 ve orijinal RetinaNet gibi modeller, bir veri kümesi için en iyi çapa boyutlarını belirlemek için manuel yapılandırma veya k-means kümeleme gibi kümeleme algoritmalarına güvenir. Bu, istikrar sağlar, ancak nesnelerin şekilleri büyük ölçüde farklılık gösteriyorsa katı olabilir.
  • Anchor-Free: YOLO26 dahil olmak üzere modern mimariler, genellikle anchor aşamasını tamamen ortadan kaldırır. Bu mimariler, nesne merkezlerini ve boyutlarını doğrudan özellik haritası piksellerinden tahmin eder, böylece hesaplama yükünü azaltır ve hiperparametre aramasını basitleştirir. Bu "uçtan uca" yaklaşım, genellikle çeşitli veriler üzerinde daha hızlı ve daha kolay eğitilebilir .

Gerçek Dünya Uygulamaları

Çapa tabanlı mantık, nesne şekillerinin öngörülebilir ve tutarlı olduğu birçok eski ve özel üretim sisteminde hala geçerlidir .

  • Trafik İzleme: Akıllı ulaşım sistemlerinde, kameralar akışı yönetmek veya ihlalleri tespit etmek için detect . Otomobiller ve kamyonlar standart boyutlara sahip olduğundan, çapa tabanlı modeller belirli önsel bilgilerle ayarlanarak hassasiyet ve geri çağırma oranları en üst düzeye çıkarılabilir.
  • Perakende Otomasyonu: Otomatik ödeme sistemleri, ürünleri tanımlamak için bilgisayar görüşünü kullanır. Mısır gevreği kutuları gibi paketlenmiş ürünler sabit bir en boy oranına sahip olduğundan, bağlantı noktaları ağ için güçlü bir öncül sağlar ve karmaşık bir ortamda benzer görünümlü öğeleri ayırt etmesine yardımcı olur.

Uygulama Örneği

En son YOLO26 modelleri üstün performans için çapa içermeyen kafalar kullanırken, algılama çalıştırma arayüzü tutarlı kalmaktadır. Ultralytics ve Python , bir modelin çapa mı yoksa merkez noktası mı kullandığı konusundaki karmaşıklığı ortadan kaldırarak, kullanıcıların sonuçlara odaklanmalarını sağlar.

Aşağıda, bir modeli yükleme ve detect için çıkarım yapma işlemi anlatılmaktadır. Bu iş akışı, temel bağlantı mimarisinden bağımsız olarak uygulanır:

from ultralytics import YOLO

# Load the YOLO26 model (optimized for speed and accuracy)
model = YOLO("yolo26n.pt")

# Run inference on an image source
# The model handles internal logic (anchor-based or anchor-free) automatically
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the first result with bounding boxes
results[0].show()

Daha Fazla Okuma

Algılama mekanizmalarına ilişkin anlayışınızı derinleştirmek için, Bölge Öneri Ağı'nı (RPN) tanıtan Faster R-CNN hakkındaki temel araştırmaları inceleyin veya hız için çapa tabanlı algılamayı optimize eden Tek Atışlı Çoklu Kutu Algılayıcı (SSD) hakkında bilgi edinin. Bu alana daha geniş bir bakış açısı için, COCO , hem çapa tabanlı hem de çapa tabanlı olmayan modelleri değerlendirmek için standart bir kriter görevi görür. Ayrıca, Coursera'daki ileri düzey kurslar genellikle kutu regresyonu ve çapa eşleştirmesinin matematiksel ayrıntılarını ele alır.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın