Sözlük

Görüntü Tanıma

Görüntü tanımanın yapay zekayı görselleri sınıflandırmak ve anlamak için nasıl güçlendirdiğini ve sağlık, perakende, güvenlik ve daha birçok alanda inovasyonu nasıl desteklediğini keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Görüntü tanıma, makinelerin görüntülerden veya videolardan görsel bilgileri tanımlamasını ve yorumlamasını sağlayan önemli bir yapay zeka (AI) ve bilgisayarla görme (CV) dalıdır. Sadece pikselleri görmenin ötesine geçer; görsel verilerde tasvir edilen nesneler, insanlar, sahneler ve eylemler gibi içeriği anlamayı içerir. Bu teknoloji sayısız uygulamanın temelini oluşturarak sistemlerin dünyayı insanlara benzer bir şekilde "görmesini" ve anlamlandırmasını sağlar.

Görüntü Tanıma Nasıl Çalışır?

Görüntü tanıma, özünde büyük ölçüde makine öğrenimine (ML), özellikle de derin öğrenme (DL) algoritmalarına dayanır. Konvolüsyonel Sinir Ağları (CNN'ler), görüntülerden özelliklerin uzamsal hiyerarşilerini otomatik ve uyarlanabilir bir şekilde öğrenmek için tasarlanmış temel bir bileşendir. Süreç tipik olarak, her görüntünün içeriği hakkında bilgilerle etiketlendiği ve genellikle WordNet hiyerarşisi gibi yapılar kullanılarak organize edildiği ünlü ImageNet veri kümesi gibi etiketli görüntülerin geniş veri kümeleri üzerinde bir modelin eğitilmesini içerir. Eğitim sırasında model, belirli görsel kalıpları ve özellikleri (kenarlar, dokular, şekiller gibi) farklı etiketler veya kategorilerle ilişkilendirmeyi öğrenir. ResNet gibi mimariler bu görevlerde önemli ölçüde gelişmiş performansa sahiptir. Model eğitildikten sonra yeni, görülmemiş görüntüleri analiz edebilir ve içlerinde bulunan nesneleri veya kavramları tahmin edebilir. Bu kavramların anlaşılması, Derin Öğrenme Uzmanlığı gibi kaynaklar aracılığıyla derinleştirilebilir. ImageNet sınıflandırma için önemli olsa da COCO gibi veri kümeleri daha geniş görsel anlama görevleri için de hayati öneme sahiptir. Etkili model eğitimi dikkatli bir planlama ve uygulama gerektirir.

İlgili Terimlerden Farkları

Diğer bilgisayarla görme görevleriyle ilişkili olsa da, görüntü tanıma genellikle birkaç özel yeteneği kapsayan daha geniş bir terim olarak kullanılır. Bunu daha dar görevlerden ayırmak önemlidir:

Görüntü tanıma bazen özellikle görüntü sınıflandırma anlamına gelebilir, ancak genellikle uygulamanın ihtiyaçlarına bağlı olarak algılama veya segmentasyon içerebilen daha geniş bir görüntü içeriğini anlama yeteneği anlamına gelir.

Gerçek Dünya Uygulamaları

Görüntü tanıma, çeşitli sektörlerde geniş bir uygulama yelpazesine güç verir:

Bu alan, Bilgisayarla Görme ve Örüntü Tanıma Konferansı (CVPR ) gibi yerlerde ve Bilgisayarla Görme Vakfı (CVF) gibi kuruluşlarda paylaşılan araştırmalarla sürekli olarak gelişmektedir. Google Cloud AI Blog'unda pratik bilgileri okuyun.

Araçlar ve Eğitim

Görüntü tanıma uygulamaları geliştirmek genellikle özel kütüphaneler ve çerçeveler kullanmayı gerektirir. Anahtar teknolojiler şunları içerir:

Tümünü okuyun