Yapay zeka araştırmalarını, modellerini ve uygulamalarını güçlendiren, 14 milyondan fazla görüntüyle bilgisayarla görme alanındaki gelişmeleri destekleyen çığır açan veri seti ImageNet'i keşfedin.
ImageNet, bilgisayarla görme (CV) araştırma ve geliştirmesinde yaygın olarak kullanılan çok büyük, temel bir veri kümesidir. WordNet hiyerarşisine göre düzenlenmiş, hangi nesnelerin resmedildiğini belirtmek için manuel olarak açıklanmış 14 milyondan fazla görüntüden oluşur. ImageNet, 20.000'den fazla kategori (synsets) ile özellikle görüntü sınıflandırma ve görüntü tanıma gibi görevler için makine öğrenimi (ML) modellerini eğitmek ve değerlendirmek için zengin ve çeşitli bir kaynak sağlar. Büyük ölçeği ve ayrıntılı açıklamaları, alanın ilerlemesi için çok önemli olmuştur. ImageNet Veri Kümesi dokümantasyon sayfasında Ultralytics modelleri ile veri kümesini kullanma hakkında daha fazla bilgi edinebilirsiniz.
ImageNet'in kullanıma sunulması, özellikle bilgisayarla görme alanında derin öğrenme (DL) için çok önemli bir dönüm noktası olmuştur. ImageNet'ten önce, büyük, çeşitli ve iyi etiketlenmiş veri kümelerinin eksikliği büyük bir darboğazdı. ImageNet, Evrişimsel Sinir Ağları (CNN'ler) gibi çok daha derin ve karmaşık modellerin eğitilmesini sağlayarak önemli atılımlara yol açtı. 2010'dan 2017'ye kadar her yıl düzenlenen ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC), ImageNet'in bir alt kümesini kullandı ve görüntü sınıflandırma ve nesne algılama algoritmalarını değerlendirmek için standart ölçüt haline geldi. ImageNet üzerinde son teknoloji sonuçlar elde eden AlexNet ve ResNet gibi modeller, modern CV mimarilerini büyük ölçüde etkilemiştir.
ImageNet'in birincil uygulaması, yeni bilgisayarla görme modellerini ve algoritmalarını değerlendirmek için standart bir karşılaştırma ölçütü olarak hizmet etmektir. Kıyaslamanın ötesinde, modellerin ön eğitimi için yaygın olarak kullanılmaktadır.
ImageNet sınıflandırma görevleri için geniş ve mükemmel olsa da, diğer veri kümeleri farklı amaçlara hizmet eder. Örneğin, COCO veri kümesi (Common Objects in Context) nesne algılama, segmentasyon ve başlıklandırma için yaygın olarak kullanılmaktadır ve ImageNet'e kıyasla daha az nesne kategorisi için örnek maskeleri ve sınırlayıcı kutular gibi daha ayrıntılı ek açıklamalar sunar. Benzer şekilde, Open Images V7 çok sayıda nesne sınıfı için sınırlayıcı kutular sağlar. Veri kümesi seçimi genellikle sınıflandırma, algılama veya segmentasyon gibi belirli bir bilgisayarla görme görevine bağlıdır. Çeşitli bilgisayarla görme veri kümelerini keşfetmek, bir proje için en uygun olanı seçmeye yardımcı olur.