Sözlük

Görüntü Tanıma

Görüntü tanımanın yapay zekayı görselleri sınıflandırmak ve anlamak için nasıl güçlendirdiğini ve sağlık, perakende, güvenlik ve daha birçok alanda inovasyonu nasıl desteklediğini keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Görüntü tanıma, makinelerin görüntülerden veya videolardan görsel bilgileri tanımlamasını ve yorumlamasını sağlayan önemli bir yapay zeka (AI) ve bilgisayarla görme (CV) dalıdır. Sadece pikselleri görmenin ötesine geçer; görsel verilerde tasvir edilen nesneler, insanlar, sahneler ve eylemler gibi içeriği anlamayı içerir. Bu teknoloji sayısız uygulamanın temelini oluşturarak sistemlerin dünyayı insanlara benzer bir şekilde "görmesini" ve anlamlandırmasını sağlar.

Görüntü Tanıma Nasıl Çalışır?

Görüntü tanıma, özünde büyük ölçüde makine öğrenimine (ML), özellikle de derin öğrenme (DL) algoritmalarına dayanır. Konvolüsyonel Sinir Ağları (CNN'ler), görüntülerden özelliklerin uzamsal hiyerarşilerini otomatik ve uyarlanabilir bir şekilde öğrenmek için tasarlanmış temel bir bileşendir. Süreç tipik olarak, her görüntünün içeriği hakkında bilgilerle etiketlendiği ImageNet veri kümesi gibi etiketli görüntülerden oluşan geniş veri kümeleri üzerinde bir modelin eğitilmesini içerir. Eğitim sırasında model, belirli görsel kalıpları ve özellikleri farklı etiketler veya kategorilerle ilişkilendirmeyi öğrenir. Model eğitildikten sonra yeni, görülmemiş görüntüleri analiz edebilir ve içlerinde bulunan nesneleri veya kavramları tahmin edebilir.

İlgili Terimlerden Farkları

Diğer bilgisayarla görme görevleriyle ilişkili olsa da, görüntü tanımanın kendine özgü nüansları vardır:

  • Görüntü Sınıflandırma: Genellikle görüntü tanıma ile birbirinin yerine kullanılan sınıflandırma, tipik olarak bir görüntünün tamamına tek bir birincil etiket atamaya odaklanır (örneğin, bir görüntüyü "kedi" veya "köpek" içeriyor olarak tanımlamak). Görüntü tanıma, bazen sahnedeki birden fazla nesneyi veya eylemi tanımlamak gibi daha geniş bir anlayış anlamına gelebilir. YOLOv11 gibi Ultralytics YOLO modelleri, görüntü sınıflandırma görevlerini yerine getirebilir.
  • Nesne Algılama: Bu görev, basit tanımanın bir adım ötesine geçerek yalnızca bir görüntüde hangi nesnelerin olduğunu değil, aynı zamanda tipik olarak etraflarına sınırlayıcı kutular çizerek nerede bulunduklarını da belirler.
  • Görüntü Segmentasyonu: Nesnelerin tam dış hatlarını veya şeklini belirlemek için bir görüntüdeki her bir pikseli sınıflandırarak, farklı örnekler(örnek segmentasyonu) veya kategoriler(semantik segmentasyon) arasında ayrım yaparak daha ayrıntılı bir anlayış sağlar.

Gerçek Dünya Uygulamaları

Görüntü tanıma, çeşitli sektörlerde geniş bir uygulama yelpazesine güç verir:

  • Sağlık Hizmetleri: Radyologların X-ışınları, CT taramaları ve MRI'larda tümör veya kırık gibi anomalileri tespit etmelerine yardımcı olmak için tıbbi görüntü analizinde kullanılır ve potansiyel olarak daha erken teşhislere yol açar. Örneğin, modeller tıbbi görüntülemede tümör tespiti gibi görevler için eğitilebilir.
  • Perakende: Barkodsuz ürünleri tanımlayan otomatik ödeme sistemleri gibi uygulamaları mümkün kılar, stok seviyelerini izleyerek perakende envanter yönetimini geliştirir ve mağazalardaki müşteri davranışlarını analiz eder.
  • Güvenlik ve Gözetim: Kimlik doğrulama ve erişim kontrolü için yüz tanıma sistemlerini güçlendirir ve video akışlarındaki izinsiz girişleri veya olağandışı etkinlikleri tespit ederek hırsızlığı önlemeye yönelik bilgisayar görüşü gibi sistemlere katkıda bulunur.
  • Otonom Araçlar: Sürücüsüz araçlardaki yapay zekanın yayaları, diğer araçları, trafik ışıklarını ve yol işaretlerini tanıması ve güvenli navigasyon sağlaması için gereklidir.
  • İçerik Moderasyonu: Sosyal medya platformları ve çevrimiçi hizmetler, yapay zeka etiği ilkeleri rehberliğinde deepfake 'ler veya politikaları ihlal eden görüntüler gibi uygunsuz veya zararlı içerikleri otomatik olarak tespit etmek ve filtrelemek için görüntü tanımayı kullanır.

Araçlar ve Teknolojiler

Görüntü tanıma sistemleri geliştirmek genellikle özel araçlar ve çerçeveler kullanmayı gerektirir. OpenCV gibi kütüphaneler temel görüntü işleme işlevlerini sağlarken, aşağıdaki gibi derin öğrenme çerçeveleri PyTorch ve TensorFlow karmaşık sinir ağı modelleri oluşturmak ve eğitmek için yapı taşları sunar. Ultralytics HUB gibi platformlar, tanıma ve sınıflandırma görevleri için kullanılanlar da dahil olmak üzere bilgisayarla görme modellerini eğitme, dağıtma ve yönetme sürecini kolaylaştırır.

Tümünü okuyun