Sözlük

Görüntü Sınıflandırma

Ultralytics YOLO ile görüntü sınıflandırmayı keşfedin: son teknoloji araçları kullanarak sağlık, tarım, perakende ve daha fazlası için özel modeller eğitin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Görüntü sınıflandırma, görsel içeriğine dayalı olarak tüm bir görüntüye tek bir etiket veya kategori atamayı içeren Bilgisayarla Görme (CV) alanında temel bir görevdir. Yapay Zeka (AI) içinde temel bir yetenektir ve makinelerin görüntüleri insanların sahneleri veya nesneleri tanımasına benzer şekilde anlamasını ve kategorize etmesini sağlar. Makine Öğrenimi (ML) ve özellikle Derin Öğrenme (DL) teknikleri tarafından desteklenen görüntü sınıflandırması şu soruyu yanıtlamayı amaçlar: "Bu görüntünün ana konusu nedir?". Bu görev, daha karmaşık birçok görsel anlama problemi için bir yapı taşı görevi görür.

Görüntü Sınıflandırma Nasıl Çalışır?

Bu süreç tipik olarak, genellikle Evrişimsel Sinir Ağı (CNN) adı verilen özel bir sinir ağı türü olan bir modelin, etiketli görüntülerden oluşan büyük bir veri kümesi üzerinde eğitilmesini içerir. Binlerce kategoride milyonlarca görüntü içeren ImageNet gibi ünlü veri kümeleri, sağlam modelleri eğitmek için yaygın olarak kullanılır. Eğitim sırasında model, farklı kategorileri karakterize eden dokular, şekiller, kenarlar ve renk dağılımları gibi ayırt edici desenleri ve özellikleri tanımlamayı öğrenir. Gibi çerçeveler PyTorch ve TensorFlow bu derin öğrenme modellerini oluşturmak ve eğitmek için gerekli araçları ve kütüphaneleri sağlar. Kendi projelerinize başlamak için CIFAR-100 veya MNIST gibi çeşitli Ultralytics sınıflandırma veri kümelerini keşfedebilirsiniz. Nihai hedef, eğitilen modelin yeni, daha önce görülmemiş görüntüler için sınıf etiketini doğru bir şekilde tahmin etmesidir. Altta yatan mekanizmalar hakkında daha derin bir teknik anlayış için, Stanford CS231n Görsel Tanıma için Evrişimsel Sinir Ağları kursu gibi kaynaklar kapsamlı materyal sunar.

Diğer Görme Görevlerinden Temel Farklılıklar

Görüntü sınıflandırma, görüntünün tamamına tek ve kapsayıcı bir etiket atamaya odaklanır. Bu, onu diğer yaygın bilgisayarla görme görevlerinden farklı kılar:

  • Nesne Algılama: Bu görev, yalnızca bir görüntüdeki nesneleri sınıflandırmakla kalmaz, aynı zamanda tipik olarak algılanan her örneğin etrafına sınırlayıcı kutular çizerek bunları konumlandırarak bir adım daha ileri gider. "Bu görüntüde hangi nesneler var ve nerede bulunuyorlar?" sorularına cevap verir.
  • Görüntü Segmentasyonu: Bu, görüntüdeki her bir pikselin sınıflandırılmasını içerir.
    • Anlamsal Segmentasyon Aynı sınıfın farklı örnekleri arasında ayrım yapmadan her piksele bir sınıf etiketi (örneğin, 'araba', 'yol', 'gökyüzü') atar.
    • Örnek Segmentasyonu Her bir ayrı nesneye ait piksellere benzersiz bir tanımlayıcı atayarak (örneğin, 'araba 1', 'araba 2' etiketlemesi) nesnelerin bireysel örnekleri arasında ayrım yapar.

Bu farklılıkları anlamak, her görev görüntü içeriği hakkında farklı bir ayrıntı düzeyi sağladığından, belirli bir sorun için uygun tekniği seçmek açısından çok önemlidir.

Gerçek Dünya Uygulamaları

Görüntü sınıflandırma, görsel bilgileri kategorize etmedeki etkinliği nedeniyle çeşitli alanlarda yaygın olarak kullanılmaktadır:

  • Tıbbi Görüntü Analizi: Teşhise yardımcı olmak için tıbbi taramaların (X ışınları, CT taramaları veya MRI'lar gibi) sınıflandırılması. Örneğin, bir model, tümör tespiti için YOLO modellerinin kullanılması gibi belirli bir durumun belirtilerini gösteren taramaları sınıflandırmak ve böylece radyologlara yardımcı olmak için eğitilebilir. Sağlık Çözümlerinde Yapay Zeka hakkında daha fazlasını keşfedin.
  • Tarım Teknolojisi: Hastalıkları tanımlamak, bitki sağlığını değerlendirmek veya olgunluğu belirlemek için mahsul görüntülerinin sınıflandırılması. Örneğin bir uygulama, bir drone veya çiftçi tarafından çekilen fotoğrafları 'sağlıklı buğday' veya 'buğday pası tespit edildi' şeklinde sınıflandırarak zamanında müdahale edilmesini sağlayabilir. Tarımda bilgisayarla görme hakkında daha fazla bilgi edinin.
  • Perakende ve E-ticaret: Çevrimiçi kataloglar için ürün resimlerini otomatik olarak kategorize ederek aranabilirliği ve envanter yönetimini iyileştirir.
  • İçerik Moderasyonu: Sosyal medya veya web sitelerindeki görüntüleri güvenli veya uygunsuz olarak sınıflandırarak filtreleme.
  • Yaban Hayatı Koruma: Hayvan popülasyonlarını izlemek ve türleri(zebralar gibi) tanımlamak için kamera tuzaklarından gelen görüntüleri sınıflandırmak.

Ultralytics ile Görüntü Sınıflandırma

Ultralytics YOLO modelleri, nesne algılama konusunda ünlü olmakla birlikte, görüntü sınıflandırma görevlerinde de güçlü performans göstermektedir. Gibi son teknoloji mimariler Ultralytics YOLO11 sezgisel Ultralytics Python paketi veya kodsuz Ultralytics HUB platformu kullanılarak sınıflandırma için kolayca eğitilebilir veya ince ayar yapılabilir. Bu araçlar, model eğitimi ipuçları ve görüntü sınıflandırması için Ultralytics YOLO11 ' in nasıl kullanılacağına ilişkin kılavuz gibi açık belgeler de dahil olmak üzere kapsamlı kaynaklar sağlar. Daha fazla pratik için PyTorch sınıflandırma eğitimlerini keşfetmeyi veya Kaggle görüntü sınıflandırma yarışmalarına katılmayı düşünün. En son araştırma gelişmelerinden haberdar olmak için Papers With Code gibi kaynaklar çok değerlidir. Ayrıca YOLO model performansını standart kıyaslamalarla da karşılaştırabilirsiniz.

Tümünü okuyun