Yüksek hızlı gerçek zamanlı yapay zeka için tek aşamalı nesne algılayıcılarını keşfedin. Ultralytics Edge AI ve dağıtım için nasıl üstün doğruluk ve verimlilik sağladığını öğrenin.
Tek aşamalı nesne algılayıcılar, nesne algılama görevlerini olağanüstü bir hız ve verimlilikle gerçekleştirmek üzere tasarlanmış güçlü bir derin öğrenme mimarisi sınıfıdır. Algılama sürecini bölge önerisi ve sonraki sınıflandırma için ayrı adımlara ayıran geleneksel iki aşamalı nesne algılayıcıların aksine, tek aşamalı modeller tek bir geçişte görüntünün tamamını analiz eder. Algılamayı doğrudan regresyon sorunu olarak çerçeveleyerek, bu ağlar Algılamayı doğrudan bir regresyon sorunu olarak çerçeveleyen bu ağlar, sınırlayıcı kutu koordinatlarını ve sınıf olasılıklarını doğrudan giriş piksellerinden tahmin eder. Bu akıcı yaklaşım, hesaplama yükünü önemli ölçüde azaltır ve tek aşamalı algılayıcıları, kaynakları sınırlı kenar AI cihazlarında gerçek zamanlı çıkarım ve dağıtım gerektiren uygulamalar için tercih edilen seçenek haline getirir.
Tek aşamalı dedektörün mimarisi genellikle, bir konvolüsyonel sinir ağı (CNN) etrafında şekillenir ve bu ağ, backbone olarak işlev görür. Bir görüntü ağdan geçerken, model uzamsal ve anlamsal bilgileri kodlayan bir özellik haritaları ızgarası oluşturur.
Single Shot MultiBox Detector (SSD) gibi erken uygulamalar, nesneleri konumlandırmak için çeşitli ölçeklerde önceden tanımlanmış bağlantı kutularına güveniyordu. Ancak, Ultralytics YOLO11 ve son teknoloji ürünü YOLO26 gibi modern gelişmeler, büyük ölçüde ankrajsız tasarımlara doğru kaymıştır. Bu yeni mimari, nesnelerin merkezlerini ve boyutlarını doğrudan tahmin ederek, ankrajlarla ilişkili karmaşık hiperparametre ayarlaması ihtiyacını ortadan kaldırır. Nihai çıktı, konumlandırma için koordinat vektörleri ve algılanan nesneye ilişkin modelin kesinliğini temsil eden güven puanından oluşur.
Bu iki ana kategoriyi birbirinden ayırmak, belirli bir görev için doğru aracı seçmeye yardımcı olur:
Tek aşamalı dedektörlerin verimliliği, anında tepki verme yeteneğinin kritik olduğu çeşitli endüstrilerde yaygın olarak benimsenmelerini sağlamıştır :
Tek aşamalı bir dedektörün uygulanması, modern üst düzey API'ler kullanılarak kolayca gerçekleştirilebilir. Doğru sonuçlar elde etmek için modeller genellikle birden fazla potansiyel kutu tahmin eder ve bunlar daha sonra Birleşim Üzerinde Kesişim (IoU) eşiklerine dayalı Maksimum Olmayan Bastırma (NMS) gibi teknikler kullanılarak filtrelenir, ancak YOLO26 gibi daha yeni uçtan uca modeller bunu doğal olarak gerçekleştirir.
Aşağıdaki Python , son teknoloji ürünü YOLO26 modelini yüklemeyi ve bir görüntü üzerinde çıkarım yapmayı göstermektedir:
from ultralytics import YOLO
# Load the YOLO26 model, the latest natively end-to-end one-stage detector
model = YOLO("yolo26n.pt")
# Run inference on an image URL to detect objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the first result with bounding boxes and labels
results[0].show()
Tek aşamalı dedektörlerin gelişimi, "doğruluk ve hız" arasındaki dengeyi sağlamaya odaklanmıştır. Eğitim sırasında sınıf dengesizliğini gidermek için Focal Loss gibi teknikler geliştirilmiş ve modelin, bol miktarda bulunan arka plan yerineclassify üzerinde odaklanmasını sağlamıştır. Ayrıca, Feature Pyramid Networks (FPN) entegrasyonu, bu modellerin farklı ölçeklerdeki detect etkili bir şekilde detect .
Günümüzde araştırmacılar ve geliştiriciler, Ultralytics gibi araçları kullanarak bu gelişmiş mimarileri özel veri kümeleri üzerinde kolayca eğitebiliyorlar. Bu Ultralytics , veri etiketlemeden model dağıtımına kadar iş akışını basitleştiriyor. Tarım veya sağlık hizmetleri gibi alanlarda, tek aşamalı algılayıcıların erişilebilirliği, güçlü bilgisayar görme yeteneklerini demokratikleştiriyor.