Yarı denetimli öğrenmenin, etiketli ve etiketlenmemiş verileri birleştirerek model doğruluğunu nasıl artırdığını keşfedin. Ultralytics kullanarak SSL iş akışlarını uygulamayı öğrenin.
Yarı denetimli öğrenme (SSL), makine öğreniminde (ML) iki geleneksel eğitim yöntemi arasında köprü görevi gören stratejik bir paradigmadır. Denetimli öğrenme tamamen tamamen etiketlenmiş veri kümelerine dayanırken, denetimsiz öğrenme herhangi bir etiket olmadan verilerde kalıplar bulmaya çalışır. SSL ise az miktarda etiketli veriyi çok daha büyük bir etiketlenmemiş veri havuzuyla birleştirerek çalışır. Bu yaklaşım, özellikle güvenlik kameralarından veya uydulardan alınan video görüntüleri gibi ham görüntülerin toplanmasının nispeten ucuz olduğu, ancak insan uzmanlar tarafından veri etiketleme sürecinin maliyetli, yavaş ve yoğun emek gerektiren gerçek dünya bilgisayar görme (CV) senaryolarında SSL, etiketlenmemiş örneklerin içinde gizli olan yapıyı etkili bir şekilde kullanarak, kapsamlı bir açıklama bütçesi gerektirmeden model doğruluğunu ve genellemeyi önemli ölçüde iyileştirebilir.
SSL'nin temel amacı, etiketli küçük örnek kümesinde bulunan bilgileri daha büyük etiketlenmemiş kümeye yaymaktır. Bu, sinir ağının verilerin düşük yoğunluklu bölgelerinden geçen karar sınırlarını öğrenmesini sağlar ve daha sağlam sınıflandırma veya algılama ile sonuçlanır.
Çoğu yarı denetimli iş akışını iki popüler teknik yönlendirmektedir:
Aşağıdaki Python , ultralytics paketini kullanan basit bir sözde etiketleme iş akışını göstermektedir. Burada, küçük bir veri kümesinde bir YOLO26 modeli eğitiyoruz ve ardından bunu, etiketlenmemiş görüntülerin bulunduğu bir dizin için etiketler oluşturmak üzere kullanıyoruz.
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# Train initially on a small available labeled dataset
model.train(data="coco8.yaml", epochs=10)
# Run inference on unlabeled data to generate pseudo-labels
# Setting save_txt=True saves the detections as text files for future training
results = model.predict(source="./unlabeled_images", save_txt=True, conf=0.85)
Yarı denetimli öğrenme, verilerin bol olduğu ancak uzmanlığın az olduğu sektörleri dönüştürüyor.
AI çözümlerini etkili bir şekilde uygulamak için, SSL'nin benzer stratejilerden nasıl farklı olduğunu anlamak çok önemlidir:
Derin öğrenme (DL) modellerinin boyutu büyüdükçe, veri kullanımının verimliliği çok önemli hale geliyor. PyTorch ve TensorFlow , bu gelişmiş eğitim döngüleri için hesaplama arka ucunu sağlar . Ayrıca, Ultralytics gibi araçlar veri kümesi yönetiminin yaşam döngüsünü basitleştiriyor. Otomatik açıklama gibi özellikleri kullanarak ekipler, yarı denetimli iş akışlarını daha kolay bir şekilde uygulayabilir ve ham verileri hızla üretime hazır model ağırlıklarına dönüştürebilir. MLOps'taki bu gelişme, yüksek doğruluklu görme sistemleri oluşturmanın önündeki engellerin daha da azalmasını sağlıyor.