Sözlük

Nesne Algılama

Nesne algılamanın gücünü keşfedin - YOLO gibi son teknoloji modellerle görüntülerdeki veya videolardaki nesneleri tanımlayın ve bulun. Gerçek dünya uygulamalarını keşfedin!

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Nesne algılama, bir görüntü veya video içindeki bir veya daha fazla nesnenin varlığını, konumunu ve türünü tanımlamayı içeren bilgisayarla görmede (CV) temel bir görevdir. Bir görüntünün tamamına tek bir etiket atayan görüntü sınıflandırmanın aksine, nesne algılama, bir sınırlayıcı kutu kullanarak her nesne örneğini kesin olarak ana hatlarıyla belirler ve ona bir sınıf etiketi atar. Bu özellik, makinelerin görsel sahneleri daha ayrıntılı bir şekilde anlamasına olanak tanıyarak insanların görsel algısını daha yakından yansıtır.

Nesne Algılama Nasıl Çalışır?

Nesne tespiti tipik olarak iki temel görevi birleştirir: nesne sınıflandırması ('hangi' nesnenin mevcut olduğunu belirleme) ve nesne lokalizasyonu ('nesnenin nerede' bulunduğunu belirleme). Modern nesne algılama sistemleri büyük ölçüde derin öğrenmeye (DL), özellikle de Evrişimsel Sinir Ağlarına (CNN'ler) dayanır. Bu ağlar, farklı nesne sınıflarıyla ilişkili özellikleri ve kalıpları öğrenmek için popüler COCO veri kümesi gibi büyük veri kümeleri üzerinde eğitilir. Model bir giriş görüntüsünü işler ve her biri ilişkili bir sınıf etiketi (örneğin, 'araba', 'kişi') ve bir güven puanı içeren sınırlayıcı kutuların bir listesini çıkarır. Bu modellerin performansı genellikle Birlik Üzerinde Kesişim (IoU) ve Ortalama Hassasiyet (mAP) gibi metrikler kullanılarak ölçülür.

Nesne Algılama ve İlgili Görevler

Nesne algılamayı diğer ilgili bilgisayarla görme görevlerinden ayırmak önemlidir:

  • Görüntü Sınıflandırma: Bir görüntünün tamamına tek bir etiket atar (örneğin, "Bu görüntüde bir kedi var"). Nesne(ler) için konum bilgisi sağlamaz.
  • Görüntü Segmentasyonu: Bir görüntüdeki her bir pikseli sınıflandırır. Anlamsal Segmentasyon her piksele bir sınıf etiketi atarken (örneğin, arabalara ait tüm pikseller 'araba' olarak etiketlenir), Örnek Segmentasyonu aynı sınıfın farklı örnekleri arasında ayrım yapar (örneğin, 'araba 1', 'araba 2' olarak etiketleme). Segmentasyon, nesne algılamanın sınırlayıcı kutularından daha ayrıntılı uzamsal bilgi sağlar.

Nesne Algılama Modellerinin Türleri

Nesne algılama modelleri genellikle iki kategoriye ayrılır:

  • İki Aşamalı Dedektörler: Bu modeller önce nesnelerin bulunabileceği ilgi bölgeleri (RoIs) önerir ve ardından bu bölgelerdeki nesneleri sınıflandırır. Örnekler arasında R-CNN ailesi(Bölge tabanlı CNN) bulunmaktadır. Genellikle yüksek doğruluk elde ederler ancak daha yavaş olabilirler.
  • Tek Aşamalı Dedektörler: Bu modeller, doğrudan görüntü ızgarası üzerinde tek bir geçişte yerelleştirme ve sınıflandırma gerçekleştirir. Örnekler şunları içerir Ultralytics YOLO gibi modeller YOLOv8 ve YOLOv11. Tipik olarak daha hızlıdırlar, bu da onları gerçek zamanlı çıkarım için uygun hale getirir. Çapasız dedektörler gibi yeni yaklaşımlar tespit sürecini daha da basitleştirir. Ödünleşimlerini anlamak için farklı YOLO modelleri arasındaki karşılaştırmaları keşfedebilirsiniz.

Gerçek Dünya Uygulamaları

Nesne algılama, çeşitli sektörlerdeki sayısız uygulama için çok önemlidir:

  • Otonom Sistemler: Güvenli navigasyon için yayaları, diğer araçları, trafik işaretlerini ve engelleri tespit etmek üzere sürücüsüz araçlarda yapay zeka için araçların etkinleştirilmesi. Waymo'nun teknolojisi büyük ölçüde sofistike nesne tespitine dayanıyor.
  • Gözetim ve Güvenlik: Yetkisiz erişim için alanların izlenmesi, şüpheli faaliyetlerin tespit edilmesi veya otomatik güvenlik alarm sistemlerinin uygulanması.
  • Perakende Analitiği: Yapay zeka odaklı envanter yönetimi için raflardaki ürünleri takip etme, müşteri yaya trafiğini analiz etme ve ödeme süreçlerini iyileştirme.
  • Sağlık Hizmetleri: X-ışınları veya MRI gibi taramalarda tümörleri, lezyonları veya diğer anormallikleri tanımlayarak tıbbi görüntü analizine yardımcı olmak. Radiology gibi dergilerde yayınlanan araştırmalar : Yapay Zeka genellikle bu tür uygulamaları içerir.
  • Tarım: Tarım çözümlerinde yapay zeka kullanarak mahsul sağlığını izlemek, zararlıları tespit etmek ve hasat süreçlerini otomatikleştirmek.

Araçlar ve Eğitim

Nesne algılama modelleri geliştirmek, özel araçlar ve platformlar kullanmayı gerektirir. Gibi çerçeveler PyTorch ve TensorFlow yapı taşlarını sağlar. OpenCV gibi kütüphaneler temel bilgisayarla görme işlevlerini sunar. Ultralytics son teknoloji ürünü Ultralytics YOLO modelleri ve Ultralytics HUB platformu, özel modelleri eğitme, veri kümelerini yönetme ve çözümleri verimli bir şekilde dağıtma sürecini basitleştirir. Etkili model eğitimi genellikle dikkatli hiperparametre ayarlama ve veri artırma stratejileri gerektirir.

Tümünü okuyun