Eğitim verisi olmadan classify detect classify için Zero-Shot Learning (ZSL) teknolojisini keşfedin. Ultralytics YOLO gerçek zamanlı açık sözlük algılamayı nasıl mümkün kıldığını öğrenin.
Zero-Shot Learning (ZSL), yapay zeka modellerinin eğitim aşamasında hiç karşılaşmadıkları detect tanıma, classify veya detect olanağı sağlayan bir makine öğrenimi paradigmasıdır. Geleneksel denetimli öğrenmede, bir modelin tanımlaması gereken her bir kategori için binlerce etiketli örneğe ihtiyacı vardır. ZSL, görülen ve görülmeyen sınıflar arasındaki boşluğu doldurmak için yardımcı bilgileri (genellikle metin açıklamaları, anlamsal öznitelikler veya gömülü bilgiler) kullanarak bu katı bağımlılığı ortadan kaldırır. Bu özellik, yapay zeka (AI) sistemlerinin çok daha esnek, ölçeklenebilir ve her olası nesne için kapsamlı veri toplamak pratik olmayan dinamik ortamları yönetebilmesini sağlar.
ZSL'nin temel mekanizması, paylaşılan bir anlamsal alan kullanarak tanıdık kavramlardan tanıdık olmayan kavramlara bilgi aktarımı yapmaktır. semantik alan. Sadece siyah ve beyaz çizgilerin piksel desenlerini ezberleyerek "zebra"yı tanımayı öğrenmek yerine, model görsel özellikler ile doğal dil işleme (NLP) kaynaklı anlamsal özellikler (örneğin, "at benzeri şekil", "çizgili desen", "dört bacak") arasındaki ilişkiyi öğrenir. Bu, modelin "zebra"yı tanımak için sadece siyah ve beyaz çizgilerin piksel desenlerini ezberlemesine gerek kalmadan,
Bu süreç genellikle görüntü ve metin temsillerini uyumlu hale getiren çok modlu modellere dayanır. Örneğin, OpenAI'nin CLIP gibi temel araştırmalar, modellerin doğal dil denetiminden görsel kavramları nasıl öğrenebileceğini gösterir. ZSL modeli, görünmeyen bir nesneyle karşılaştığında, görsel özellikleri çıkarır ve Bir ZSL modeli görülmemiş bir nesneyle karşılaştığında, görsel özellikleri çıkarır ve bunları anlamsal vektörler sözlüğüyle karşılaştırır. Görsel özellikler yeni sınıfın anlamsal açıklamasıyla uyumluysa , model classify doğru bir şekilde classify ve etkili bir şekilde "sıfır atış" tahmini gerçekleştirebilir. Bu yaklaşım, geniş bir görev yelpazesinde genelleme yapan modern temel modeller için temeldir.
Zero-Shot Learning, sistemlerin ilk eğitim verilerinin ötesinde genelleme yapabilmelerini sağlayarak çeşitli sektörlerde yenilikçiliği teşvik etmektedir. .
Ultralytics YOLO modeli, Zero-Shot Learning'in işleyişini örneklemektedir. Kullanıcıların, modeli yeniden eğitmeden çalışma sırasında dinamik olarak özel sınıflar tanımlamasına olanak tanır. Bu , doğal dili anlayan bir metin kodlayıcı backbone sağlam bir algılama backbone birbirine bağlayarak gerçekleştirilir.
Aşağıdaki Python , YOLO kullanarak,
standart eğitim setinin açıkça bir parçası olmayan detect ultralytics Paket.
from ultralytics import YOLOWorld
# Load a pre-trained YOLO-World model capable of Zero-Shot Learning
model = YOLOWorld("yolov8s-world.pt")
# Define custom classes via text prompts (e.g., specific accessories)
# The model adjusts to detect these new classes without retraining
model.set_classes(["blue backpack", "red apple", "sunglasses"])
# Run inference on an image to detect the new zero-shot classes
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Display the results
results[0].show()
ZSL'yi tam olarak anlamak için, onu şu alanlarda kullanılan benzer öğrenme stratejilerinden ayırmak yararlı olacaktır bilgisayar görüşü (CV):
ZSL büyük bir potansiyel sunarken, eğitim sırasında öğrenilen anlamsal özelliklerin görülmemiş sınıfların görsel görünümüne tam olarak uymadığı etki alanı kayması sorunu gibi zorluklarla da karşı karşıyadır. Ayrıca, ZSL modelleri, görülen sınıflar için tahmin doğruluğunun görülmemiş sınıflara kıyasla önemli ölçüde daha yüksek olduğu önyargı sorunundan muzdarip olabilir. Bu nedenle, bu çalışmada, ZSL'nin önyargı sorununu ortadan kaldırmak için bir yaklaşım geliştirilmiştir. Bu yaklaşım, ZSL'nin önyargı sorununu ortadan kaldırmak için bir yaklaşım geliştirmiştir.
Stanford Üniversitesi'nin AI Lab ve IEEE Computer Society gibi kuruluşların araştırmaları bu sınırlamaları ele almaya devam ediyor. Bilgisayar görmearaçları daha sağlam hale geldikçe, ZSL'nin standart bir özellik haline gelmesi ve büyük veri etiketleme çabalarına olan bağımlılığı azaltması bekleniyor. Gelişmiş modelleri kullanıma sunmadan önce veri kümelerini verimli bir şekilde yönetmek isteyen ekipler için Ultralytics , açıklama ve veri kümesi yönetimi için kapsamlı araçlar sunuyor.