Sözlük

Sıfır Atışla Öğrenme

Zero-Shot Learning'i keşfedin: modellerin görünmeyen verileri sınıflandırmasını sağlayan, nesne algılama, NLP ve daha fazlasında devrim yaratan son teknoloji bir yapay zeka yaklaşımı.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Zero-Shot Learning (ZSL), bir modelin eğitim sırasında açıkça görmediği nesneleri veya kavramları tanımak için eğitildiği Makine Öğrenimi (ML) içinde büyüleyici bir alandır. Her olası kategori için çok sayıda etiketli örnek gerektiren geleneksel denetimli öğrenme yöntemlerinin aksine ZSL, modellerin bu yeni sınıfları tanımlayan yardımcı bilgilerden yararlanarak görülmeyen sınıflar hakkında tahminler yapmasını sağlar. Bu özellik, özellikle akla gelebilecek her kategori için etiketli veri elde etmenin pratik olmadığı veya imkansız olduğu alanlarda, daha uyarlanabilir ve ölçeklenebilir Yapay Zeka (AI) sistemleri oluşturmak için çok önemlidir.

Zero-Shot Öğrenme Nasıl Çalışır?

ZSL'nin arkasındaki temel fikir, ortak bir anlamsal alan kullanarak görülen ve görülmeyen sınıflar arasındaki boşluğu doldurmaktır. Bu uzay genellikle metin veya bilgi tabanlarından türetilen üst düzey açıklamalara, özniteliklere veya yerleştirmelere dayanır. Eğitim sırasında model, yalnızca 'görülen' sınıflardan örnekler kullanarak giriş verileri (görüntüler veya metin gibi) ile bu anlamsal uzay arasında bir eşleme öğrenir. Örneğin, bir model at ve kaplan görüntülerini (görülen sınıflar) bunlara karşılık gelen niteliklerle ilişkilendirmeyi öğrenebilir (örneğin, "toynakları vardır", "çizgileri vardır", "bir memelidir").

Görülmemiş bir sınıfın (örneğin bir zebra) bir örneği sunulduğunda, model bu sınıfın özelliklerini çıkarır ve bunları öğrenilen anlamsal uzaya eşler. Daha sonra bu eşlemeyi görülmeyen sınıfların anlamsal tanımlarıyla karşılaştırır (örneğin, bir zebrayı tanımlayan "çizgileri vardır", "toynakları vardır", "memelidir" nitelikleri). Bu uzayda anlamsal açıklaması en yakın olan sınıf tahmin olarak seçilir. Bu süreç genellikle derin öğrenme (DL) tekniklerini içerir, özellik çıkarma için Evrişimsel Sinir Ağları (CNN'ler) gibi mimarileri ve görsel özellikleri anlamsal niteliklerle ilişkilendirmek için eşleme işlevlerini kullanır, bazen Görme Dönüştürücülerinden (ViT) veya CLIP gibi modellerden kavramlardan yararlanır.

Benzer Kavramlardan Temel Farklılıklar

ZSL'yi ilgili öğrenme paradigmalarından ayırmak önemlidir:

  • Az Atışlı Öğrenme (FSL): FSL, sınıf başına çok az sayıda etiketli örnekten (ör. 1 ila 5) yeni kavramlar öğrenmeyi amaçlarken, ZSL hedef sınıflar için sıfır etiketli örnek gerektirir. Az Atışlı, Sıfır Atışlı ve Transfer Öğrenimini anlama hakkında daha fazla bilgi edinin.
  • Tek Seferlik Öğrenme (OSL): Her yeni sınıf için tam olarak bir etiketli örneğin sağlandığı özel bir FSL durumu.
  • Transfer Öğrenme: Bir görevden elde edilen bilginin farklı ancak ilgili bir göreve uygulandığı daha geniş bir kavram. ZSL bir transfer öğrenme biçimidir, ancak özellikle tamamen görülmeyen sınıfları tanımak için bilgi aktarımına (genellikle anlamsal nitelikler aracılığıyla) odaklanır. Gibi modeller Ultralytics YOLOv8 genellikle özel eğitim için COCO gibi büyük veri kümelerinden transfer öğrenimini kullanır.
  • Kendi Kendine Denetimli Öğrenme (SSL): SSL modelleri, ön görevler oluşturarak (örneğin, bir girdinin maskelenmiş kısımlarını tahmin ederek) etiketsiz verilerden temsilleri öğrenir. Ön eğitim için faydalı olsa da SSL, ZSL'de kullanılanlar gibi ek mekanizmalar olmadan görünmeyen sınıfları doğal olarak ele almaz.

Gerçek Dünya Uygulamaları

ZSL çeşitli alanlarda önemli bir potansiyele sahiptir:

  1. Bilgisayarla Görme (CV) - İnce Taneli Nesne Tanıma: Eğitim verilerinin az olduğu görüntülerde nadir hayvan türlerinin, bitkilerin veya belirli ürün modellerinin tanımlanması. Örneğin, yaygın kuşlar üzerine eğitilmiş bir sistem, önceden görsel örnekler olmadan bile tüylerinin, gaga şeklinin ve habitatının metinsel bir açıklamasına dayanarak nadir bir türü tanımlayabilir. Bu, yalnızca görülen sınıflar üzerinde eğitilen standart nesne algılama veya görüntü sınıflandırmanın ötesinde yetenekleri genişletir. YOLO gibi modeller, açık kelime dağarcığı tespiti için benzer fikirler üzerine inşa edilmiştir.
  2. Doğal Dil İşleme (NLP) - Konu Tanımlama ve Amaç Tanıma: Belgeleri, e-postaları veya kullanıcı sorgularını, ilk eğitim veri kümesinde bulunmayan yeni, ortaya çıkan konulara veya amaçlara göre sınıflandırmak. Örneğin, bir müşteri destek sohbet robotu, bu tür sorguların açık eğitim örneklerine ihtiyaç duymadan, özelliğin açıklamasını kullanarak yeni piyasaya sürülen bir ürün özelliği hakkındaki bir sorguyu kategorize edebilir. Bu, GPT-4 gibi Büyük Dil Modellerinin (LLM'ler) gücünden yararlanır.

Zorluklar ve Gelecek Yönelimleri

Umut vaat etmesine rağmen ZSL, hubness problemi (anlamsal uzaydaki bazı noktaların birçok noktaya en yakın komşu olması) ve alan kayması (özellikler ve nitelikler arasındaki ilişkinin görülen ve görülmeyen sınıflar arasında farklılık göstermesi) gibi zorluklarla karşı karşıyadır. Araştırmalar, daha sağlam anlamsal katıştırmaları, daha iyi eşleme işlevlerini ve çıkarım sırasında hem görülen hem de görülmeyen sınıfları tanımayı amaçlayan Genelleştirilmiş Sıfır Atışlı Öğrenme (GZSL) gibi teknikleri keşfetmeye devam etmektedir. Ultralytics HUB gibi platformların geliştirilmesi, ZSL yeteneklerinin pratik görsel yapay zeka uygulamalarına entegrasyonunu ve dağıtımını kolaylaştırabilir. Daha ileri gelişmeler, görme ve dili doğal olarak birbirine bağlayan çok modlu modellerden ilham alabilir.

Tümünü okuyun