Zero-Shot Learning'i keşfedin: modellerin görünmeyen verileri sınıflandırmasını sağlayan, nesne algılama, NLP ve daha fazlasında devrim yaratan son teknoloji bir yapay zeka yaklaşımı.
Zero-Shot Learning (ZSL), bir modelin eğitim sırasında açıkça görmediği nesneleri veya kavramları tanımak için eğitildiği Makine Öğrenimi (ML) içinde büyüleyici bir alandır. Her olası kategori için çok sayıda etiketli örnek gerektiren geleneksel denetimli öğrenme yöntemlerinin aksine ZSL, modellerin bu yeni sınıfları tanımlayan yardımcı bilgilerden yararlanarak görülmeyen sınıflar hakkında tahminler yapmasını sağlar. Bu özellik, özellikle akla gelebilecek her kategori için etiketli veri elde etmenin pratik olmadığı veya imkansız olduğu alanlarda, daha uyarlanabilir ve ölçeklenebilir Yapay Zeka (AI) sistemleri oluşturmak için çok önemlidir.
ZSL'nin arkasındaki temel fikir, ortak bir anlamsal alan kullanarak görülen ve görülmeyen sınıflar arasındaki boşluğu doldurmaktır. Bu uzay genellikle metin veya bilgi tabanlarından türetilen üst düzey açıklamalara, özniteliklere veya yerleştirmelere dayanır. Eğitim sırasında model, yalnızca 'görülen' sınıflardan örnekler kullanarak giriş verileri (görüntüler veya metin gibi) ile bu anlamsal uzay arasında bir eşleme öğrenir. Örneğin, bir model at ve kaplan görüntülerini (görülen sınıflar) bunlara karşılık gelen niteliklerle ilişkilendirmeyi öğrenebilir (örneğin, "toynakları vardır", "çizgileri vardır", "bir memelidir").
Görülmemiş bir sınıfın (örneğin bir zebra) bir örneği sunulduğunda, model bu sınıfın özelliklerini çıkarır ve bunları öğrenilen anlamsal uzaya eşler. Daha sonra bu eşlemeyi görülmeyen sınıfların anlamsal tanımlarıyla karşılaştırır (örneğin, bir zebrayı tanımlayan "çizgileri vardır", "toynakları vardır", "memelidir" nitelikleri). Bu uzayda anlamsal açıklaması en yakın olan sınıf tahmin olarak seçilir. Bu süreç genellikle derin öğrenme (DL) tekniklerini içerir, özellik çıkarma için Evrişimsel Sinir Ağları (CNN'ler) gibi mimarileri ve görsel özellikleri anlamsal niteliklerle ilişkilendirmek için eşleme işlevlerini kullanır, bazen Görme Dönüştürücülerinden (ViT) veya CLIP gibi modellerden kavramlardan yararlanır.
ZSL'yi ilgili öğrenme paradigmalarından ayırmak önemlidir:
ZSL çeşitli alanlarda önemli bir potansiyele sahiptir:
Umut vaat etmesine rağmen ZSL, hubness problemi (anlamsal uzaydaki bazı noktaların birçok noktaya en yakın komşu olması) ve alan kayması (özellikler ve nitelikler arasındaki ilişkinin görülen ve görülmeyen sınıflar arasında farklılık göstermesi) gibi zorluklarla karşı karşıyadır. Araştırmalar, daha sağlam anlamsal katıştırmaları, daha iyi eşleme işlevlerini ve çıkarım sırasında hem görülen hem de görülmeyen sınıfları tanımayı amaçlayan Genelleştirilmiş Sıfır Atışlı Öğrenme (GZSL) gibi teknikleri keşfetmeye devam etmektedir. Ultralytics HUB gibi platformların geliştirilmesi, ZSL yeteneklerinin pratik görsel yapay zeka uygulamalarına entegrasyonunu ve dağıtımını kolaylaştırabilir. Daha ileri gelişmeler, görme ve dili doğal olarak birbirine bağlayan çok modlu modellerden ilham alabilir.