Yapay zeka araştırmalarını, modellerini ve uygulamalarını güçlendiren, 14 milyondan fazla görüntüyle bilgisayarla görme alanındaki gelişmeleri destekleyen çığır açan veri seti ImageNet'i keşfedin.
ImageNet, görüntü tanıma alanındaki araştırmaları ilerletmek için tasarlanmış, bilgisayarla görme alanında temel bir veri kümesidir. Başta isimler, fiiller, sıfatlar ve zarflar olmak üzere her anlamlı kavramın bir "synset" olarak adlandırıldığı English adresinin sözlüksel bir veritabanı olan WordNet hiyerarşisine göre yapılandırılmıştır. ImageNet, WordNet söz kümelerinin tamamının haritasını çıkarmayı amaçlamaktadır ve şu anda 20.000'den fazla söz kümesi için yaklaşık 14 milyon görüntü sağlamaktadır. Bu geniş koleksiyon, özellikle görüntü sınıflandırma ve nesne algılama gibi görevlerde makine öğrenimi modellerini eğitmek ve değerlendirmek için paha biçilmez bir kaynak haline getirmektedir.
ImageNet'in oluşturulması, özellikle bilgisayarla görme görevleri için derin öğrenme devrimi için çok önemli bir an olmuştur. ImageNet'ten önce, etiketli görüntü verilerinin ölçeği ve çeşitliliği, sağlam modellerin eğitilmesinde önemli kısıtlamalardı. ImageNet, araştırmacıların Evrişimsel Sinir Ağları (CNN'ler) gibi çok daha derin ve karmaşık modelleri eğitmelerini sağlayan büyük ölçekli, titizlikle eklenmiş bir veri kümesi sağlayarak bunu ele aldı. 2010'dan 2017'ye kadar her yıl düzenlenen ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC), nesne algılama ve görüntü sınıflandırma algoritmalarını değerlendirmek için bir ölçüt haline geldi. ImageNet'te kazanan modeller genellikle yeni en son teknoloji sonuçları belirledi ve modern bilgisayarla görme mimarilerinin gelişimini derinden etkiledi.
ImageNet'in etkisi Yapay Zeka ve Makine Öğrenimi kapsamındaki çok sayıda uygulamaya yayılmaktadır:
ImageNet alanın ilerlemesinde önemli bir rol oynamış olsa da, sınırlamalarını ve önyargıları ele alan ve yapay zekada görsel anlayışın kapsamını genişleten daha kapsamlı ve dengeli veri kümelerine doğru devam eden evrimi kabul etmek önemlidir. Ultralytics HUB gibi kaynaklar, gerçek dünyadaki bilgisayarla görme zorluklarının üstesinden gelmek için ImageNet gibi veri kümelerinin attığı temeller üzerine inşa edilen önceden eğitilmiş modellerin ve özel veri kümelerinin kullanımını kolaylaştırır.