Sözlük

Çapa Tabanlı Dedektörler

Çapa tabanlı dedektörlerin hassas konumlandırma, ölçeğe uyarlanabilirlik ve gerçek dünya uygulamaları ile nesne algılamada nasıl devrim yarattığını keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Çapa tabanlı algılayıcılar, nesne algılaması gerçekleştirmek için bilgisayarla görmede (CV) temel bir yaklaşımı temsil eder. Bu modeller, "çapa" veya "öncül" olarak bilinen, belirli boyutlara ve en-boy oranlarına sahip, önceden tanımlanmış bir dizi referans kutusuna dayanır. Bu çapalar, bir görüntü üzerinde başlangıç noktaları veya şablonlar olarak işlev görür ve modelin, özellikle ölçek ve şekil bakımından önemli ölçüde farklılık gösteren potansiyel nesnelerin konumunu ve sınıfını daha etkili bir şekilde tahmin etmesine yardımcı olur. Daha önceki birçok başarılı nesne algılama mimarisi bu yöntemi kullanmıştır.

Çapa Tabanlı Dedektörler Nasıl Çalışır?

Çapa tabanlı dedektörlerin arkasındaki temel fikir, giriş görüntüsü boyunca çeşitli konumlarda yoğun bir çapa kutusu ızgarası yerleştirmeyi içerir. Her bir bağlantı kutusu, önceden tanımlanmış bir ölçek ve en-boy oranına sahip potansiyel bir nesne adayını temsil eder. Eğitim süreci sırasında model her bir çapa için iki ana şey öğrenir: birincisi, çapanın ilgili bir nesne içerip içermediği (sınıflandırma) ve ikincisi, gerçek nesnenin sınırlayıcı kutusuna sıkıca uyması için çapanın konumunun ve boyutlarının nasıl ayarlanacağı (regresyon).

Büyük bir otopark görüntüsünde farklı araçları aradığınızı düşünün. Piksel piksel taramak yerine, önceden tanımlanmış dikdörtgen şablonlar (çapalar) kullanıyorsunuz: motosikletler için küçük dikey olanlar, arabalar için orta kare olanlar ve otobüsler için büyük geniş olanlar. Bu şablonları görüntü boyunca üst üste bindirirsiniz. Bir şablon bir araçla önemli ölçüde örtüştüğünde, model "Evet, bu bir araba" onayını almayı öğrenir ve arabanın sınırlarına mükemmel bir şekilde uyması için şablonu hafifçe kaydırır ve yeniden boyutlandırır. Çoğunlukla arka planı kaplayan çapalar bu şekilde sınıflandırılır. Bu yöntem, önceden tanımlanmış şekiller tarafından yönlendirilen olasılıkları sistematik olarak kapsar. Performans genellikle Birlik üzerinden Kesişim (IoU) ve Ortalama Hassasiyet (mAP) gibi metrikler kullanılarak ölçülür.

Temel Özellikler ve Avantajlar

Genellikle Evrişimsel Sinir Ağları (CNN'ler) üzerine inşa edilen çapa tabanlı dedektörler birkaç önemli özellik sunar:

  • Ölçek ve En Boy Oranı Değişkenliğini Ele Alma: Önceden tanımlanmış çapalar, farklı nesne boyutlarını ve şekillerini açıkça kapsayarak algılama sağlamlığını artırır.
  • Yapılandırılmış Öneri Üretimi: Çapalar, görüntü genelinde nesne önerileri oluşturmak için yapılandırılmış bir yol sağlayarak daha önceki bazı yöntemlere kıyasla algılamanın ilk aşamalarını basitleştirir.
  • Kanıtlanmış Performans: Faster R-CNN ve SSD (Single Shot MultiBox Detector) gibi mimariler çeşitli kıyaslama veri kümelerinde güçlü performans göstermiştir.

Ankraj Tabanlı Dedektörler ve Ankrajsız Dedektörler

Nesne tespitinde önemli bir gelişme, çapasız dedektörlerin yükselişi olmuştur. Çapa tabanlı modellerin (örn. YOLOv4) aksine, çapasız yöntemler, önceden tanımlanmış çapa şekillerine dayanmadan, genellikle kilit noktaları (köşeler veya merkezler gibi) belirleyerek veya bir noktadan nesne sınırlarına olan mesafeleri tahmin ederek nesne konumlarını ve boyutlarını doğrudan tahmin eder.

Ana ayrımlar şunlardır:

  • Karmaşıklık: Çapa tabanlı yöntemler, karmaşık ve veri setine bağlı olabilen çapa parametrelerinin (ölçekler, oranlar, yoğunluk) dikkatli bir şekilde tasarlanmasını ve ayarlanmasını gerektirir. Çapasız yöntemler bu ayarlama adımını ortadan kaldırır.
  • Esneklik: Ankrajsız dedektörler, sabit ankraj seti tarafından iyi temsil edilmeyen alışılmadık en boy oranlarına veya boyutlara sahip nesnelere daha iyi uyum sağlayabilir.
  • Verimlilik: Çapa oluşturma ve eşleştirme adımlarının kaldırılması bazen daha basit ve daha hızlı modellere yol açabilir.

Gibi modern modeller Ultralytics YOLO11 verimlilik ve basitlik avantajlarından yararlanarak çapasız yaklaşımları kullanır. YOLO11'de çapasız tespitin avantajları hakkında daha fazla bilgi edinebilirsiniz.

Gerçek Dünya Uygulamaları

Ankrajsız yöntemlere yönelik eğilime rağmen, ankraj tabanlı dedektörler çok sayıda uygulamada başarıyla kullanılmaktadır:

  1. Otonom Sürüş: Araçları, yayaları, bisikletlileri ve trafik işaretlerini tespit etmek sürücüsüz otomobiller için çok önemlidir. Çapa tabanlı modeller, bu nesneleri çeşitli mesafelerde ve perspektiflerde güvenilir bir şekilde tanımlamak için yaygın olarak kullanılmaktadır. Sürücüsüz araçlarda yapay zeka ve ilgili otonom sürüş araştırmaları hakkında daha fazla bilgi edinin.
  2. Perakende Analitiği: Stok seviyeleri için rafları izlemek, yanlış yerleştirilmiş ürünleri tespit etmek veya müşteri trafiği modellerini analiz etmek genellikle çok sayıda küçük nesneyi (ürünü) tanımlamayı içerir. Çapa tabanlı sistemler, perakende ortamlarında bulunan belirli ölçekleri ve en boy oranlarını işleyecek şekilde yapılandırılabilir. Yapay zekanın daha akıllı perakende envanter yönetimini ve genel perakende analitiği trendlerini nasıl desteklediğini keşfedin.

Çapasız yöntemler popülerlik kazanırken, çapa tabanlı dedektörleri anlamak, nesne algılamanın evrimini ve belirli bağlamlarda veya eski sistemlerde devam eden ilgilerini takdir etmek için çok önemlidir. Gibi araçlar PyTorch ve TensorFlowUltralytics HUB gibi platformlar modern dedektörlerin eğitimini ve dağıtımını kolaylaştırırken, hem çapa tabanlı hem de çapasız model geliştirmeyi destekler.

Tümünü okuyun