Sözlük

Nesne Algılama Mimarileri

Görüntü anlamanın yapay zeka omurgası olan nesne algılama mimarilerinin gücünü keşfedin. Türleri, araçları ve gerçek dünya uygulamalarını bugün öğrenin!

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Nesne algılama mimarileri, yapay zeka (AI) sistemlerinin görsel bilgileri nasıl yorumladığını destekleyen temel yapılardır. Bu özel sinir ağları sadece bir görüntüdeki nesneleri sınıflandırmak ( neyin mevcut olduğunu belirlemek) için değil, aynı zamanda tipik olarak tespit edilen her örneğin etrafına sınırlayıcı kutular çizerek onları tam olarak konumlandırmak için tasarlanmıştır. Temel makine öğrenimi (ML) kavramlarına aşina olanlar için bu mimarileri anlamak, modern bilgisayarla görmenin (CV) yeteneklerinden yararlanmak için çok önemlidir. Makinelerin dünyayı insanlara benzer bir şekilde "görmesini" ve anlamasını sağlayan sistemlerin bel kemiğini oluştururlar.

Çekirdek Bileşenler

Çoğu nesne algılama mimarisi birlikte çalışan birkaç temel bileşenden oluşur. Genellikle bir Evrişimsel Sinir Ağı (CNN) olan bir omurga ağı, giriş görüntüsünden ilk özellik çıkarma işlemini gerçekleştirerek kenarlar ve dokular gibi düşük seviyeli desenleri ve giderek daha karmaşık özellikleri tanımlar. Bunu genellikle bir "boyun" bileşeni takip eder ve çeşitli ölçeklerdeki nesneleri tespit etmeye uygun daha zengin temsiller oluşturmak için omurganın farklı aşamalarındaki özellikleri bir araya getirir; bu kavram Özellik Piramidi Ağı makalesi gibi kaynaklarda ayrıntılı olarak açıklanmıştır. Son olarak, algılama kafası nesnelerin sınıfını ve konumunu (sınırlayıcı kutu koordinatları) tahmin etmek için bu özellikleri kullanır. Performans genellikle yerelleştirme doğruluğunu değerlendirmek için Birlik Üzerinden Kesişim (IoU ) ve genel algılama kalitesi için Ortalama Hassasiyet (mAP ) gibi metrikler kullanılarak ölçülür ve COCO veri seti değerlendirme sayfası gibi sitelerde ayrıntılı açıklamalar mevcuttur.

Mimari Türleri

Nesne algılama mimarileri, yaklaşımlarına göre genel olarak sınıflandırılır:

Benzer Terimlerden Ayırt Etme

Nesne algılama mimarilerini ilgili bilgisayarla görme görevlerinden ayırmak önemlidir:

  • Görüntü Sınıflandırma: Bir görüntünün tamamına tek bir etiket atar (örneğin, "kedi", "köpek"). Görüntüde genel olarak ne olduğunu tanımlar, ancak belirli nesnelerin nerede bulunduğunu tanımlamaz. Örnekler için Ultralytics sınıflandırma görevi belgelerine bakın.
  • Anlamsal Segmentasyon: Bir görüntüdeki her pikseli önceden tanımlanmış bir kategoride sınıflandırır (örneğin, arabalara ait tüm pikseller "araba" olarak etiketlenir). Yoğun tahmin sağlar ancak aynı nesne sınıfının farklı örnekleri arasında ayrım yapmaz.
  • Örnek Segmentasyonu: Her bir pikseli sınıflandırarak ve ayrı nesne örnekleri arasında ayrım yaparak (örneğin, "araba 1", "araba 2" etiketlemesi) anlamsal segmentasyondan bir adım daha ileri gider. Nesne algılama ve anlamsal segmentasyonu birleştirir. Daha fazla ayrıntı için Ultralytics segmentasyon görevi belgelerine bakın.

Gerçek Dünya Uygulamaları

Nesne algılama mimarileri, farklı sektörlerdeki çok sayıda yapay zeka uygulamasına güç veriyor:

Araçlar ve Teknolojiler

Bu mimarilere dayalı modellerin geliştirilmesi ve dağıtılması genellikle özel araçlar ve çerçeveler gerektirir:

Tümünü okuyun