Sözlük

ImageNet

Yapay zeka araştırmalarını, modellerini ve uygulamalarını güçlendiren, 14 milyondan fazla görüntüyle bilgisayarla görme alanındaki gelişmeleri destekleyen çığır açan veri seti ImageNet'i keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

ImageNet, bilgisayarla görme (CV) araştırma ve geliştirmesinde yaygın olarak kullanılan çok büyük, temel bir veri kümesidir. WordNet hiyerarşisine göre düzenlenmiş, hangi nesnelerin resmedildiğini belirtmek için manuel olarak açıklanmış 14 milyondan fazla görüntüden oluşur. ImageNet, 20.000'den fazla kategori (synsets) ile özellikle görüntü sınıflandırma ve görüntü tanıma gibi görevler için makine öğrenimi (ML) modellerini eğitmek ve değerlendirmek için zengin ve çeşitli bir kaynak sağlar. Büyük ölçeği ve ayrıntılı açıklamaları, alanın ilerlemesi için çok önemli olmuştur. ImageNet Veri Kümesi dokümantasyon sayfasında Ultralytics modelleri ile veri kümesini kullanma hakkında daha fazla bilgi edinebilirsiniz.

Önem ve Uygunluk

ImageNet'in kullanıma sunulması, özellikle bilgisayarla görme alanında derin öğrenme (DL) için çok önemli bir dönüm noktası olmuştur. ImageNet'ten önce, büyük, çeşitli ve iyi etiketlenmiş veri kümelerinin eksikliği büyük bir darboğazdı. ImageNet, Evrişimsel Sinir Ağları (CNN'ler) gibi çok daha derin ve karmaşık modellerin eğitilmesini sağlayarak önemli atılımlara yol açtı. 2010'dan 2017'ye kadar her yıl düzenlenen ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC), ImageNet'in bir alt kümesini kullandı ve görüntü sınıflandırma ve nesne algılama algoritmalarını değerlendirmek için standart ölçüt haline geldi. ImageNet üzerinde son teknoloji sonuçlar elde eden AlexNet ve ResNet gibi modeller, modern CV mimarilerini büyük ölçüde etkilemiştir.

ImageNet Uygulamaları

ImageNet'in birincil uygulaması, yeni bilgisayarla görme modellerini ve algoritmalarını değerlendirmek için standart bir karşılaştırma ölçütü olarak hizmet etmektir. Kıyaslamanın ötesinde, modellerin ön eğitimi için yaygın olarak kullanılmaktadır.

  • Transfer Öğrenimi için Ön Eğitim: ImageNet üzerinde eğitilen modeller, çok çeşitli diğer görme görevleri için yararlı olan genel görsel özellikleri öğrenir. Transfer öğrenimi olarak bilinen bu teknik, geliştiricilerin çok daha küçük, özel veri kümeleri kullanarak belirli uygulamalar için önceden eğitilmiş modelleri ( Ultralytics HUB'da bulunanlar gibi) uyarlamasına olanak tanıyarak eğitim süresini ve veri gereksinimlerini önemli ölçüde azaltır. Birçok Ultralytics YOLO Örneğin modeller, büyük veri kümeleri üzerinde önceden eğitilmiş ağırlıklardan yararlanır.
  • İlerleyen Araştırma: ImageNet, temsil öğrenimi, alan uyarlaması ve derin sinir ağlarının iç işleyişini anlama gibi alanlarda araştırmaları desteklemeye devam ediyor.

Gerçek Dünyadan Örnekler

  1. Tıbbi Görüntü Analizi: ImageNet tıbbi görüntüler içermese de, üzerinde önceden eğitilmiş modeller tıbbi görüntü analizindeki görevler için bir başlangıç noktası olarak sıklıkla kullanılır. ImageNet'ten öğrenilen genel özellik çıkarma yetenekleri, tümör tespiti için YOLO kullanımı gibi uygulamalarda gösterildiği gibi, tümörler veya kırıklar gibi anormallikleri tespit etmeye yardımcı olmak için daha küçük X-ışınları, CT taramaları veya MRI veri kümeleri üzerinde ince ayar yapılabilir.
  2. Otonom Araçlar: Nesne tanıma modelleri otonom araçlar için temel öneme sahiptir. Yayaları, arabaları, trafik ışıklarını ve yol işaretlerini tanımlamak için kullanılan temel modellerin birçoğu ilk olarak ImageNet kullanılarak geliştirilmiş ve kıyaslanmıştır; bu da veri kümesinin sürücüsüz araçlarda yapay zeka için algılama sistemlerinin oluşturulmasındaki rolünü göstermektedir.

ImageNet ve Diğer Veri Kümeleri

ImageNet sınıflandırma görevleri için geniş ve mükemmel olsa da, diğer veri kümeleri farklı amaçlara hizmet eder. Örneğin, COCO veri kümesi (Common Objects in Context) nesne algılama, segmentasyon ve başlıklandırma için yaygın olarak kullanılmaktadır ve ImageNet'e kıyasla daha az nesne kategorisi için örnek maskeleri ve sınırlayıcı kutular gibi daha ayrıntılı ek açıklamalar sunar. Benzer şekilde, Open Images V7 çok sayıda nesne sınıfı için sınırlayıcı kutular sağlar. Veri kümesi seçimi genellikle sınıflandırma, algılama veya segmentasyon gibi belirli bir bilgisayarla görme görevine bağlıdır. Çeşitli bilgisayarla görme veri kümelerini keşfetmek, bir proje için en uygun olanı seçmeye yardımcı olur.

Tümünü okuyun