AI'da Tek Seferlik Öğrenmeyi Keşfedin. Verimli bilgisayar görüşü için Ultralytics ve Siamese ağlarını kullanarak tek bir görüntüden classify nasıl classify öğrenin.
One-Shot Learning, tek bir eğitim örneğinden nesne kategorileri hakkında bilgi öğrenmek için tasarlanmış, makine öğreniminde (ML) kullanılan özel bir sınıflandırma tekniğidir. Etkili bir genelleme yapmak için binlerce açıklamalı görüntü içeren büyük veri kümelerine ihtiyaç duyan geleneksel derin öğrenme (DL) algoritmalarından farklı olarak, One-Shot Learning, yeni bir kavramı anında kavrama konusunda insanın bilişsel yeteneğini taklit eder. Örneğin , bir kişi genellikle egzotik bir kuşu sadece bir kez gördükten sonra tanıyabilir; bu metodoloji, yapay zeka (AI) sistemlerinde bu verimliliği taklit etmeye çalışır. Bu , veri etiketlemenin pahalı olduğu, verilerin kıt olduğu veya tüm modeli yeniden eğitmeden dinamik olarak yeni kategorilerin eklenmesi gereken senaryolarda özellikle değerlidir.
Tek Atışlı Öğrenmenin temel prensibi, hedefi standart sınıflandırmadan benzerlik değerlendirmesine kaydırmaktır. Sinir ağını (NN) belirli bir sınıf etiketi (örneğin, "köpek" veya "kedi") çıkarmak için eğitmek yerine, model bir mesafe fonksiyonu öğrenir. Bunun için kullanılan yaygın bir mimari Siyam sinir ağıdır. Bu ağ, aynı model ağırlıklarını paylaşan iki özdeş alt ağdan oluşur.
Çalışma sırasında, ağ giriş görüntülerini gömme olarak bilinen kompakt sayısal vektörlere dönüştürmek için özellik çıkarma işlemi gerçekleştirir. Sistem daha sonra yeni bir sorgu görüntüsünün gömmesini tek bir referans görüntünün gömmesiyle karşılaştırır "çekim"in gömülmesiyle karşılaştırır. Genellikle Öklid mesafesi veya kosinüs benzerliğikullanılarak hesaplanan matematiksel mesafe belirli bir eşiğin altındaysa, görüntülerin aynı sınıfa ait olduğu belirlenir. Bu, modelin kimliği doğrulamasını veya classify öğrenilen özellik uzayındaki yakınlıklarına göre classify sağlar.
Aşağıdaki Python , gömülü öğeleri nasıl çıkaracağınızı ve bir
YOLO26 sınıflandırma modelinden
ultralytics Paket.
import numpy as np
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model for feature extraction
model = YOLO("yolo26n-cls.pt")
# Extract embeddings for a reference 'shot' and a query image
# The embed() method returns the feature vector directly
shot_vec = model.embed("reference_img.jpg")[0]
query_vec = model.embed("query_img.jpg")[0]
# Calculate similarity (higher dot product implies greater similarity)
similarity = np.dot(shot_vec, query_vec) / (np.linalg.norm(shot_vec) * np.linalg.norm(query_vec))
print(f"Similarity Score: {similarity:.4f}")
One-Shot Learning'i diğer veri verimli öğrenme tekniklerinden ayırmak önemlidir, çünkü bunlar farklı kısıtlamalarla benzer sorunları çözerler:
One-Shot Learning, büyük miktarda eğitim verisi toplamak pratik olmayan sektörlerde yeni olanaklar sunmuştur. .
One-Shot Learning'in en yaygın uygulaması biyometrik güvenliktir. Akıllı telefonda Face ID'yi kurarken veya çalışan erişim sistemine kaydolurken, cihaz kullanıcının yüzünün tek bir matematiksel temsilini yakalar . Günlük kullanım sırasında, yüz tanıma sistemi canlı kamera görüntüsünü bu depolanan "tek çekim" ile karşılaştırarak kimliği doğrular. Bu, temel FaceNet araştırmasında tartışılanlar gibi sağlam gömme tekniklerine dayanır ve ışıklandırma veya açıdaki değişikliklerin benzerlik eşleşmesini bozmamasını sağlar .
Üretimde yapay zeka alanında, "kusurlu" parçaların dengeli bir veri seti oluşturmak zordur, çünkü kusurlar nadir ve tutarsızdır. Tek Seferlik Öğrenme , bilgisayar görme (CV) sistemlerinin tek bir "mükemmel" referans parçanın temsilini öğrenmesini sağlar. Montaj hattındaki herhangi bir parça, bu referanstan Montaj hattındaki bu referanstan önemli ölçüde uzak bir gömme sonucu veren herhangi bir parça, anormallik tespiti için işaretlenir. Bu, binlerce bozuk parça görüntüsüne ihtiyaç duymadan anında kalite güvence sağlar ve bu görüntüler Ultralytics aracılığıyla yönetilebilir ve dağıtılabilir .
Güçlü olmasına rağmen, Tek Seferlik Öğrenme gürültüye karşı hassastır; tek referans görüntüsü bulanık, engellenmiş veya temsili değilse, modelin o sınıfı tanıma yeteneği önemli ölçüde azalır. Araştırmacılar genellikle meta öğrenmeyi veya "öğrenmeyi öğrenmeyi" kullanarak model kararlılığını ve genellemeyi iyileştirirler. Mimariler geliştikçe, YOLO26 gibi yeni modeller, tek seferlik çıkarımları daha hızlı ve daha doğru hale getiren daha sağlam özellik çıkarıcıları içermekte ve daha uyarlanabilir ve akıllı kenar AI cihazlarının önünü açmaktadır.