Etiketsiz verilerdeki gizli kalıpları keşfetmek için denetimsiz öğrenmeyi keşfedin. Kümeleme, anomali tespiti ve bunların modern yapay zeka çözümlerini nasıl desteklediğini öğrenin.
Denetimsiz öğrenme, bir algoritmanın insan müdahalesi olmadan etiketlenmemiş verilerden kalıpları öğrendiği bir makine öğrenimi türüdür. Modeli eğitmek için etiketli girdi-çıktı çiftlerine dayanan denetimli öğrenmenin aksine, denetimsiz öğrenme geçmiş etiketleri olmayan verilerle ilgilenir. Sistem, temel olarak girdi verileri içindeki gizli yapıları, kalıpları veya ilişkileri keşfederek kendini eğitmeye çalışır. Bu yaklaşım, günümüzde üretilen verilerin büyük çoğunluğunun (görüntüler, videolar, metinler ve sensör günlükleri) yapılandırılmamış ve etiketlenmemiş olması nedeniyle özellikle değerlidir.
Denetimsiz senaryolarda, algoritma verilerdeki ilginç yapıları keşfetmek için kendi başına bırakılır. Amaç genellikle verilerin temel dağılımını modellemek veya verilerin kendisi hakkında daha fazla bilgi edinmektir. Eğitim sırasında "doğru cevaplar" sağlanmadığından, model geleneksel anlamda doğruluk açısından değerlendirilemez. Bunun yerine, performans genellikle modelin boyutlulukları ne kadar iyi azalttığı veya benzer veri noktalarını ne kadar iyi kümelediği ile ölçülür.
Bu metodoloji, insanların genellikle yeni kavramları nasıl öğrendiğini yansıtmaktadır. Örneğin, bir çocuk, başlangıçta "köpek" ve "kedi" isimlerini bilmese de, farklı şekillerini ve davranışlarını gözlemleyerek köpekleri ve kedileri ayırt edebilir. Benzer şekilde, denetimsiz algoritmalar, içsel benzerliklere dayalı olarak bilgileri gruplandırır. Bu yetenek, sistemlerin sürekli insan denetimi olmadan yeni ortamlara uyum sağlamasına olanak tanıdığından, yapay genel zeka (AGI) geliştirilmesinde temel öneme sahiptir.
Denetimsiz öğrenme, her biri farklı türde veri analizi sorunlarına uygun olan birkaç farklı tekniği kapsar :
Denetimsiz öğrenmeyi denetimli öğrenmeden ayırmak önemlidir. Temel fark kullanılan verilerde yatmaktadır. Denetimli öğrenme, etiketli bir veri kümesi gerektirir, yani her eğitim örneği doğru bir çıktı ile eşleştirilir (örneğin, "kedi" etiketli bir kedi resmi). Model, hatayı en aza indirmek için girdileri çıktılara eşlemeyi öğrenir.
Buna karşılık, denetimsiz öğrenme etiketlenmemiş verileri kullanır. Modelin çıktısının doğru olup olmadığını belirten bir geri bildirim döngüsü yoktur. Öğrenme doğruluğunu artırmak için az miktarda etiketlenmiş veriyi büyük miktarda etiketlenmemiş veriyle birleştiren yarı denetimli öğrenme adlı bir orta yol vardır ve bu yöntem genellikle verileri etiketlemek pahalı veya zaman alıcı olduğunda kullanılır. Öğrenme doğruluğunu artırmak için az miktarda etiketlenmiş veriyi büyük miktarda etiketlenmemiş veriyle birleştiren yarı denetimli öğrenme adlı bir orta yol vardır ve bu yöntem genellikle verileri etiketlemek pahalı veya zaman alıcı olduğunda kullanılır.
Denetimsiz öğrenme, günlük hayatımızda karşılaştığımız birçok teknolojinin temelini oluşturur. İşte iki somut örnek:
Oysa Ultralytics YOLO26 öncelikle denetimli bir nesne
algılama çerçevesi olmakla birlikte, denetimsiz teknikler genellikle ön işleme adımlarında, örneğin bağlantı kutusu
dağılımlarını analiz etmek veya veri kümesi özelliklerini kümelemek gibi, kullanılır. Aşağıda, sklearn K-Means
kümeleme, temel bir denetimsiz teknik.
import numpy as np
from sklearn.cluster import KMeans
# Generate synthetic data: 10 points with 2 features each
X = np.array([[1, 2], [1, 4], [1, 0], [10, 2], [10, 4], [10, 0]])
# Initialize KMeans with 2 clusters (k=2)
kmeans = KMeans(n_clusters=2, random_state=0, n_init="auto")
# Fit the model to the data (no labels provided!)
kmeans.fit(X)
# Predict which cluster each point belongs to
print(f"Labels: {kmeans.labels_}")
# Output will group the first 3 points together (0) and the last 3 together (1)
Modern derin öğrenme (DL), giderek denetimsiz ilkeleri entegre etmektedir. Öz Denetimli Öğrenme (SSL) gibi teknikler, modellerin verilerden kendi denetim sinyallerini üretmelerine olanak tanır. Örneğin, Doğal Dil İşleme (NLP) alanında, GPT-4 gibi modeller, cümlenin bir sonraki kelimesini tahmin etmek için büyük miktarda metin üzerinde önceden eğitilir ve böylece açık etiketler olmadan dilin yapısını etkili bir şekilde öğrenir.
Benzer şekilde, bilgisayar görme (CV) alanında da otomatik kodlayıcılar verimli veri kodlamalarını öğrenmek için kullanılır. Bu sinir ağları, görüntüleri daha düşük boyutlu bir temsile sıkıştırır ve ardından yeniden oluşturur. Bu süreç, ağa görsel verilerin en belirgin özelliklerini öğretir ve bu da görüntü gürültüsünün giderilmesi ve üretken modelleme gibi görevler için yararlıdır.
Eğitim için veri kümelerini yönetmek isteyenler için Ultralytics , veri dağılımlarını görselleştirmeye yarayan araçlar sunar. Bu araçlar, denetimli eğitim süreci başlamadan önce kümeleri veya anomalileri belirlemeye yardımcı olabilir. Denetimsiz keşif yoluyla verilerinizin yapısını anlamak, genellikle sağlam AI çözümleri oluşturmanın ilk adımıdır.