Sözlük

Nesne Algılama Mimarileri

Görüntü anlamanın yapay zeka omurgası olan nesne algılama mimarilerinin gücünü keşfedin. Türleri, araçları ve gerçek dünya uygulamalarını bugün öğrenin!

Nesne algılama mimarileri, yapay zeka (AI) sistemlerinin görsel bilgileri nasıl yorumladığını destekleyen temel yapılardır. Bu özel sinir ağları sadece bir görüntüdeki nesneleri sınıflandırmak ( neyin mevcut olduğunu belirlemek) için değil, aynı zamanda tipik olarak tespit edilen her örneğin etrafına sınırlayıcı kutular çizerek onları tam olarak konumlandırmak için tasarlanmıştır. Temel makine öğrenimi (ML) kavramlarına aşina olanlar için bu mimarileri anlamak, modern bilgisayarla görmenin (CV) yeteneklerinden yararlanmak için çok önemlidir. Makinelerin dünyayı insanlara benzer bir şekilde "görmesini" ve anlamasını sağlayan sistemlerin bel kemiğini oluştururlar.

Çekirdek Bileşenler

Çoğu nesne algılama mimarisi birlikte çalışan birkaç temel bileşenden oluşur. Genellikle bir Evrişimsel Sinir Ağı (CNN) olan bir omurga ağı, giriş görüntüsünden ilk özellik çıkarma işlemini gerçekleştirerek kenarlar ve dokular gibi düşük seviyeli desenleri ve giderek daha karmaşık özellikleri tanımlar. Bunu genellikle bir "boyun" bileşeni takip eder ve çeşitli ölçeklerdeki nesneleri tespit etmeye uygun daha zengin temsiller oluşturmak için omurganın farklı aşamalarındaki özellikleri bir araya getirir; bu kavram Özellik Piramidi Ağı makalesi gibi kaynaklarda ayrıntılı olarak açıklanmıştır. Son olarak, algılama kafası nesnelerin sınıfını ve konumunu (sınırlayıcı kutu koordinatları) tahmin etmek için bu özellikleri kullanır. Performans genellikle yerelleştirme doğruluğunu değerlendirmek için Birlik Üzerinden Kesişim (IoU ) ve genel algılama kalitesi için Ortalama Hassasiyet (mAP ) gibi metrikler kullanılarak ölçülür ve COCO veri seti değerlendirme sayfası gibi sitelerde ayrıntılı açıklamalar mevcuttur.

Mimari Türleri

Nesne algılama mimarileri, yaklaşımlarına göre genel olarak sınıflandırılır:

İki Aşamalı Dedektörler: Bu modeller önce nesnelerin bulunabileceği ilgi bölgeleri (RoI) önerir ve ardından her RoI için sınırlayıcı kutuyu sınıflandırır ve iyileştirir. Örnekler arasında Faster R-CNN gibi R-CNN ailesi yer alır. Genellikle yüksek doğruluğa sahiptirler ancak hesaplama açısından yoğun olabilirler.
Tek Aşamalı Dedektörler: Bu modeller, bölge önerme adımını atlayarak giriş görüntüsünden sınırlayıcı kutuları ve sınıf olasılıklarını tek bir geçişte doğrudan tahmin eder. Örnekler arasında Tek Atışlı Çoklu Kutu Dedektörü (SSD) ve Ultralytics YOLO ailesi. Genellikle daha yüksek gerçek zamanlı çıkarım hızları sunarlar, bu da onları hızlı yanıt gerektiren uygulamalar için uygun hale getirir. gibi modern tek aşamalı dedektörler YOLO11 genellikle çapasız teknikler kullanır ve eski çapa tabanlı yöntemlere kıyasla tasarımı basitleştirir. Evrimlerini görmek için farklı YOLO modelleri arasındaki karşılaştırmaları inceleyebilirsiniz.

Benzer Terimlerden Ayırt Etme

Nesne algılama mimarilerini ilgili bilgisayarla görme görevlerinden ayırmak önemlidir:

Görüntü Sınıflandırma: Bir görüntünün tamamına tek bir etiket atar (örneğin, "kedi", "köpek"). Görüntüde genel olarak ne olduğunu tanımlar, ancak belirli nesnelerin nerede bulunduğunu tanımlamaz. Örnekler için Ultralytics sınıflandırma görevi belgelerine bakın.
Anlamsal Segmentasyon: Bir görüntüdeki her pikseli önceden tanımlanmış bir kategoride sınıflandırır (örneğin, arabalara ait tüm pikseller "araba" olarak etiketlenir). Yoğun tahmin sağlar ancak aynı nesne sınıfının farklı örnekleri arasında ayrım yapmaz.
Örnek Segmentasyonu: Her bir pikseli sınıflandırarak ve ayrı nesne örnekleri arasında ayrım yaparak (örneğin, "araba 1", "araba 2" etiketlemesi) anlamsal segmentasyondan bir adım daha ileri gider. Nesne algılama ve anlamsal segmentasyonu birleştirir. Daha fazla ayrıntı için Ultralytics segmentasyon görevi belgelerine bakın.

Gerçek Dünya Uygulamaları

Nesne algılama mimarileri, farklı sektörlerdeki çok sayıda yapay zeka uygulamasına güç veriyor:

Otonom Araçlar: Sürücüsüz araçların yayaları, diğer araçları, trafik işaretlerini ve şerit işaretlerini algılayarak çevrelerini algılamaları için gereklidir. Waymo gibi şirketler büyük ölçüde sofistike nesne algılamaya güveniyor. Sürücüsüz araçlarda yapay zeka hakkında daha fazla bilgi edinin.
Güvenlik ve Gözetim: Güvenlik sistemlerinde yetkisiz erişimi tespit etmek, olağandışı faaliyetler için kalabalıkları izlemek veya yüz tanıma uygulamak için kullanılır. Pratik bir örnek için Ultralytics Güvenlik Alarm Sistemi Kılavuzu 'na bakın.
Tıbbi Görüntü Analizi: Radyologlara X-ışınları, CT taramaları ve MRI'larda tümör veya kırık gibi anomalileri tespit etmede yardımcı olur. YOLO11'i kullanarak Sağlık Hizmetlerinde Yapay Zeka çözümlerini ve tümör tespiti gibi özel uygulamaları keşfedin.
Perakende Analitiği: Envanter yönetimi için otomatik ödeme, raf izleme ve yapay zeka gibi uygulamaları etkinleştirir.

Araçlar ve Teknolojiler

Bu mimarilere dayalı modellerin geliştirilmesi ve dağıtılması genellikle özel araçlar ve çerçeveler gerektirir:

Derin Öğrenme Çerçeveleri: Gibi kütüphaneler PyTorch (resmi PyTorch web sitesini ziyaret edin) ve TensorFlow ( TensorFlow web sitesine bakın) temel yapı taşlarını sağlar.
Bilgisayarla Görme Kütüphaneleri: OpenCV (resmi site: OpenCV.org) görüntü işleme ve manipülasyon için geniş bir fonksiyon yelpazesi sunar.
Modeller ve Platformlar: Ultralytics , son teknoloji Ultralytics YOLO modelleri ve Ultralytics HUB platformu sağlayarak özel modellerin eğitilmesi, veri kümelerinin yönetilmesi(COCO gibi) ve çözümlerin dağıtılması sürecini basitleştirir.
Açık Kaynak: Birçok nesne algılama mimarisi ve aracı, açık kaynak lisansları altında geliştirilmekte ve yapay zeka topluluğu içinde işbirliğini ve yeniliği teşvik etmektedir. GitHub gibi kaynaklar bu alanda çok sayıda projeye ev sahipliği yapmaktadır.

Nesne Algılama Mimarileri

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

İnovasyonunuza güç katacak esnek kurumsal lisanslama çözümü

Yapay zeka modellerini saniyeler içinde eğitin Ultralytics YOLO

Ultralytics HUB ile YOLO modellerini kolayca eğitin

Çekirdek Bileşenler

Mimari Türleri

Benzer Terimlerden Ayırt Etme

Gerçek Dünya Uygulamaları

Araçlar ve Teknolojiler

Daha fazla blog okuyun

Ultralytics topluluğuna katılın

Nesne Algılama Mimarileri

YOLO modellerini Ultralytics HUB ile basitçeeğitin

İnovasyonunuza güç katacak esnek kurumsal lisanslama çözümü

Yapay zeka modellerini saniyeler içinde eğitin Ultralytics YOLO

Ultralytics HUB ile YOLO modellerini kolayca eğitin

Çekirdek Bileşenler

Mimari Türleri

Benzer Terimlerden Ayırt Etme

Gerçek Dünya Uygulamaları

Araçlar ve Teknolojiler

Daha fazla blog okuyun

Ultralytics topluluğuna katılın

YOLO modellerini Ultralytics HUB ile basitçe
eğitin