Yarı Denetimli Öğrenmenin yapay zeka modellerini geliştirmek, etiketleme maliyetlerini azaltmak ve doğruluğu artırmak için etiketli ve etiketsiz verileri nasıl birleştirdiğini keşfedin.
Yarı Denetimli Öğrenme (SSL), eğitim sırasında az miktarda etiketli veriyi büyük miktarda etiketsiz veri ile birleştirerek Makine Öğreniminde (ML) güçlü bir orta yolu temsil eder. Bu yaklaşım özellikle etiketli veri elde etmenin pahalı, zaman alıcı veya pratik olmadığı, ancak etiketsiz verinin bol olduğu senaryolarda değerlidir. SSL, model performansını yalnızca sınırlı etiketli veriler kullanılarak elde edilebilecek olanın ötesinde iyileştirmek için etiketsiz verilerdeki temel yapıdan yararlanmayı amaçlar ve bu da onu birçok gerçek dünya Yapay Zeka (AI) problemi için pratik bir teknik haline getirir.
SSL algoritmaları, etiketli ve etiketsiz veriler arasındaki ilişki hakkında belirli varsayımlar yaparak çalışır. Yaygın varsayımlar arasında 'pürüzsüzlük varsayımı' (birbirine yakın noktaların bir etiketi paylaşması muhtemeldir) veya 'küme varsayımı' (veriler farklı kümeler oluşturma eğilimindedir ve aynı küme içindeki noktalar muhtemelen bir etiketi paylaşır) yer alır. Teknikler genellikle etiketli veriler üzerinde bir başlangıç modelinin eğitilmesini ve ardından bu modelin yüksek güvenirlikli tahminlere dayalı olarak etiketsiz veriler için sözde etiketler oluşturmak üzere kullanılmasını içerir. Model daha sonra hem orijinal etiketli veriler hem de yeni sözde etiketli veriler üzerinde yeniden eğitilir. Diğer bir yaklaşım ise modelin, girdisi hafifçe bozulsa bile etiketsiz bir örnek için aynı çıktıyı üretmeye teşvik edildiği tutarlılık düzenlemesidir ve genellikle veri artırımı yoluyla elde edilir. Bu yöntemler, modelin geniş etiketlenmemiş örnek havuzunun doğasında bulunan kalıplardan ve dağılımdan öğrenmesini sağlar. Daha gelişmiş teknikler, SSL hakkındakiGoogle AI Blog gönderileri gibi kaynaklarda incelenmiştir.
Yarı Denetimli Öğrenme, diğer birincil öğrenme türleri arasında benzersiz bir yer kaplar:
SSL, etiketlemenin darboğaz oluşturduğu alanlarda oldukça etkilidir:
SSL'nin birincil avantajı, büyük etiketli veri kümelerine olan bağımlılığı azaltarak veri etiketleme ile ilgili zaman ve kaynaklardan tasarruf sağlamasıdır. Etiketlenmemiş örneklerden gelen bilgileri kullanarak sınırlı veriler üzerinde eğitilen tamamen denetimli modellere kıyasla genellikle daha iyi model genellemesi sağlar. Bununla birlikte, SSL'nin başarısı büyük ölçüde verilerle ilgili temel varsayımların doğru olmasına bağlıdır. Bu varsayımlar geçerli değilse (örneğin, etiketsiz veri dağılımı etiketli veriden çok farklıysa), SSL yöntemleri performansı bile düşürebilir. SSL tekniklerinin dikkatli bir şekilde seçilmesi ve uygulanması çok önemlidir ve genellikle MLOps uygulamalarında uzmanlık gerektirir.
Aşağıdakiler de dahil olmak üzere birçok modern Derin Öğrenme (DL) çerçevesi PyTorchPyTorch resmi sitesi) ve TensorFlowTensorFlow resmi sitesi), işlevler sunar veya SSL algoritmalarını uygulamak için uyarlanabilir. Scikit-learn gibi kütüphaneler bazı SSL yöntemleri sağlar. Ultralytics HUB gibi platformlar, etiketli ve etiketsiz verilerin karışımlarını içerebilen veri kümelerinin yönetimini kolaylaştırarakUltralytics Ultralytics HUB VeriKümeleri dokümantasyonu), bu tür veri yapılarından yararlanmak için tasarlanmış modellerin eğitiminiUltralytics HUB Bulut Eğitimi) ve dağıtımını(model dağıtım seçenekleri kılavuzu) basitleştirerek süreci kolaylaştırır. SSL'deki araştırmalar, NeurIPS ve ICML gibi büyük AI konferanslarında sıklıkla sunulan katkılarla gelişmeye devam ediyor.