Ultralytics YOLO ile görüntü sınıflandırmayı keşfedin: son teknoloji araçları kullanarak sağlık, tarım, perakende ve daha fazlası için özel modeller eğitin.
Görüntü sınıflandırma, görsel içeriğine dayalı olarak tüm bir görüntüye tek bir etiket veya kategori atamayı içeren Bilgisayarla Görme (CV) alanında temel bir görevdir. Yapay Zeka (AI) içinde temel bir yetenektir ve makinelerin görüntüleri insanların sahneleri veya nesneleri tanımasına benzer şekilde anlamasını ve kategorize etmesini sağlar. Makine Öğrenimi (ML) ve özellikle Derin Öğrenme (DL) teknikleri tarafından desteklenen görüntü sınıflandırması şu soruyu yanıtlamayı amaçlar: "Bu görüntünün ana konusu nedir?". Bu görev, daha karmaşık birçok görsel anlama problemi için bir yapı taşı görevi görür.
Bu süreç tipik olarak, genellikle Evrişimsel Sinir Ağı (CNN) adı verilen özel bir sinir ağı türü olan bir modelin, etiketli görüntülerden oluşan büyük bir veri kümesi üzerinde eğitilmesini içerir. Binlerce kategoride milyonlarca görüntü içeren ImageNet gibi ünlü veri kümeleri, sağlam modelleri eğitmek için yaygın olarak kullanılır. Eğitim sırasında model, farklı kategorileri karakterize eden dokular, şekiller, kenarlar ve renk dağılımları gibi ayırt edici desenleri ve özellikleri tanımlamayı öğrenir. Gibi çerçeveler PyTorch ve TensorFlow bu derin öğrenme modellerini oluşturmak ve eğitmek için gerekli araçları ve kütüphaneleri sağlar. Kendi projelerinize başlamak için CIFAR-100 veya MNIST gibi çeşitli Ultralytics sınıflandırma veri kümelerini keşfedebilirsiniz. Nihai hedef, eğitilen modelin yeni, daha önce görülmemiş görüntüler için sınıf etiketini doğru bir şekilde tahmin etmesidir. Altta yatan mekanizmalar hakkında daha derin bir teknik anlayış için, Stanford CS231n Görsel Tanıma için Evrişimsel Sinir Ağları kursu gibi kaynaklar kapsamlı materyal sunar.
Görüntü sınıflandırma, görüntünün tamamına tek ve kapsayıcı bir etiket atamaya odaklanır. Bu, onu diğer yaygın bilgisayarla görme görevlerinden farklı kılar:
Bu farklılıkları anlamak, her görev görüntü içeriği hakkında farklı bir ayrıntı düzeyi sağladığından, belirli bir sorun için uygun tekniği seçmek açısından çok önemlidir.
Görüntü sınıflandırma, görsel bilgileri kategorize etmedeki etkinliği nedeniyle çeşitli alanlarda yaygın olarak kullanılmaktadır:
Ultralytics YOLO modelleri, nesne algılama konusunda ünlü olmakla birlikte, görüntü sınıflandırma görevlerinde de güçlü performans göstermektedir. Gibi son teknoloji mimariler Ultralytics YOLO11 sezgisel Ultralytics Python paketi veya kodsuz Ultralytics HUB platformu kullanılarak sınıflandırma için kolayca eğitilebilir veya ince ayar yapılabilir. Bu araçlar, model eğitimi ipuçları ve görüntü sınıflandırması için Ultralytics YOLO11 ' in nasıl kullanılacağına ilişkin kılavuz gibi açık belgeler de dahil olmak üzere kapsamlı kaynaklar sağlar. Daha fazla pratik için PyTorch sınıflandırma eğitimlerini keşfetmeyi veya Kaggle görüntü sınıflandırma yarışmalarına katılmayı düşünün. En son araştırma gelişmelerinden haberdar olmak için Papers With Code gibi kaynaklar çok değerlidir. Ayrıca YOLO model performansını standart kıyaslamalarla da karşılaştırabilirsiniz.