Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Gözetimsiz Öğrenme

Etiketsiz verilerdeki gizli kalıpları keşfetmek için denetimsiz öğrenmeyi keşfedin. Kümeleme, anomali tespiti ve bunların modern yapay zeka çözümlerini nasıl desteklediğini öğrenin.

Denetimsiz öğrenme, bir algoritmanın insan müdahalesi olmadan etiketlenmemiş verilerden kalıpları öğrendiği bir makine öğrenimi türüdür. Modeli eğitmek için etiketli girdi-çıktı çiftlerine dayanan denetimli öğrenmenin aksine, denetimsiz öğrenme geçmiş etiketleri olmayan verilerle ilgilenir. Sistem, temel olarak girdi verileri içindeki gizli yapıları, kalıpları veya ilişkileri keşfederek kendini eğitmeye çalışır. Bu yaklaşım, günümüzde üretilen verilerin büyük çoğunluğunun (görüntüler, videolar, metinler ve sensör günlükleri) yapılandırılmamış ve etiketlenmemiş olması nedeniyle özellikle değerlidir.

Denetimsiz Öğrenmenin İşleyişi

Denetimsiz senaryolarda, algoritma verilerdeki ilginç yapıları keşfetmek için kendi başına bırakılır. Amaç genellikle verilerin temel dağılımını modellemek veya verilerin kendisi hakkında daha fazla bilgi edinmektir. Eğitim sırasında "doğru cevaplar" sağlanmadığından, model geleneksel anlamda doğruluk açısından değerlendirilemez. Bunun yerine, performans genellikle modelin boyutlulukları ne kadar iyi azalttığı veya benzer veri noktalarını ne kadar iyi kümelediği ile ölçülür.

Bu metodoloji, insanların genellikle yeni kavramları nasıl öğrendiğini yansıtmaktadır. Örneğin, bir çocuk, başlangıçta "köpek" ve "kedi" isimlerini bilmese de, farklı şekillerini ve davranışlarını gözlemleyerek köpekleri ve kedileri ayırt edebilir. Benzer şekilde, denetimsiz algoritmalar, içsel benzerliklere dayalı olarak bilgileri gruplandırır. Bu yetenek, sistemlerin sürekli insan denetimi olmadan yeni ortamlara uyum sağlamasına olanak tanıdığından, yapay genel zeka (AGI) geliştirilmesinde temel öneme sahiptir.

Denetimsiz Öğrenmede Temel Teknikler

Denetimsiz öğrenme, her biri farklı türde veri analizi sorunlarına uygun olan birkaç farklı tekniği kapsar :

  • Kümeleme: Bu, algoritmanın birbirine benzer veri noktalarını gruplandırdığı en yaygın uygulamadır. Popüler bir yöntem, K-Means kümelemesidir. Bu yöntem, verileri özellik benzerliğine göre k farklı gruba böler. Bu yöntem, benzer satın alma davranışlarına sahip müşteri gruplarını belirlemek için pazar segmentasyonunda yaygın olarak kullanılır.
  • Boyut Azaltma: Yüksek boyutlu veriler karmaşık ve hesaplama açısından pahalı olabilir. İşleme. Temel Bileşen Analizi (PCA) gibi teknikler, veri kümesindeki değişkenlerin sayısını azaltırken, temel bilgileri korur. Bu, veri görselleştirmeyi basitleştirir ve diğer makine öğrenimi modellerinin eğitimini hızlandırır.
  • Anomali Tespiti: "Normal" verilerin neye benzediğini öğrenerek, denetimsiz modeller normdan önemli ölçüde sapan aykırı değerleri tespit edebilir. Bu, olağandışı işlem modellerinin güvenlik uyarılarını tetiklediği finans sektöründe dolandırıcılık tespiti için çok önemlidir.
  • İlişki Kuralı Öğrenimi: Bu teknik, büyük veritabanlarındaki değişkenler arasındaki ilginç ilişkileri keşfeder. Pazar sepeti analizinde yaygın olarak kullanılır ve perakendecilerin ekmek satın alan müşterilerin aynı zamanda tereyağı da satın alma olasılığının yüksek olduğunu anlamalarına yardımcı olur.

Denetimsiz öğrenme ve denetimli öğrenme

Denetimsiz öğrenmeyi denetimli öğrenmeden ayırmak önemlidir. Temel fark kullanılan verilerde yatmaktadır. Denetimli öğrenme, etiketli bir veri kümesi gerektirir, yani her eğitim örneği doğru bir çıktı ile eşleştirilir (örneğin, "kedi" etiketli bir kedi resmi). Model, hatayı en aza indirmek için girdileri çıktılara eşlemeyi öğrenir.

Buna karşılık, denetimsiz öğrenme etiketlenmemiş verileri kullanır. Modelin çıktısının doğru olup olmadığını belirten bir geri bildirim döngüsü yoktur. Öğrenme doğruluğunu artırmak için az miktarda etiketlenmiş veriyi büyük miktarda etiketlenmemiş veriyle birleştiren yarı denetimli öğrenme adlı bir orta yol vardır ve bu yöntem genellikle verileri etiketlemek pahalı veya zaman alıcı olduğunda kullanılır. Öğrenme doğruluğunu artırmak için az miktarda etiketlenmiş veriyi büyük miktarda etiketlenmemiş veriyle birleştiren yarı denetimli öğrenme adlı bir orta yol vardır ve bu yöntem genellikle verileri etiketlemek pahalı veya zaman alıcı olduğunda kullanılır.

Gerçek Dünya Uygulamaları

Denetimsiz öğrenme, günlük hayatımızda karşılaştığımız birçok teknolojinin temelini oluşturur. İşte iki somut örnek:

  1. Perakendede Müşteri Segmentasyonu: E-ticaret platformları, önceden tanımlanmış kategoriler olmadan milyonlarca kullanıcı etkileşimini analiz eder. Kümeleme algoritmaları kullanarak, "hafta sonu indirim avcıları" veya "teknoloji meraklıları" gibi farklı kullanıcı profillerini belirler. Bu, son derece kişiselleştirilmiş pazarlama kampanyaları ve öneri sistemlerine olanak tanır ve müşteri deneyimini önemli ölçüde iyileştirir.
  2. Genomik Dizi Analizi: Biyoinformatikte, araştırmacılar genetik verileri analiz etmek için denetimsiz öğrenmeyi kullanırlar. Algoritmalar, farklı popülasyonlar arasında benzer genetik belirteçleri veya mutasyonları bulmak için DNA dizilerini kümeler. Bu, her bir genin işlevine ilişkin önceden bilgiye ihtiyaç duymadan evrimsel ilişkileri anlamaya ve hastalıklara genetik yatkınlıkları belirlemeye yardımcı olur.

Kod Örneği: Scikit-Learn ile Kümeleme

Oysa Ultralytics YOLO26 öncelikle denetimli bir nesne algılama çerçevesi olmakla birlikte, denetimsiz teknikler genellikle ön işleme adımlarında, örneğin bağlantı kutusu dağılımlarını analiz etmek veya veri kümesi özelliklerini kümelemek gibi, kullanılır. Aşağıda, sklearn K-Means kümeleme, temel bir denetimsiz teknik.

import numpy as np
from sklearn.cluster import KMeans

# Generate synthetic data: 10 points with 2 features each
X = np.array([[1, 2], [1, 4], [1, 0], [10, 2], [10, 4], [10, 0]])

# Initialize KMeans with 2 clusters (k=2)
kmeans = KMeans(n_clusters=2, random_state=0, n_init="auto")

# Fit the model to the data (no labels provided!)
kmeans.fit(X)

# Predict which cluster each point belongs to
print(f"Labels: {kmeans.labels_}")
# Output will group the first 3 points together (0) and the last 3 together (1)

Derin Öğrenmede Denetimsiz Öğrenmenin Rolü

Modern derin öğrenme (DL), giderek denetimsiz ilkeleri entegre etmektedir. Öz Denetimli Öğrenme (SSL) gibi teknikler, modellerin verilerden kendi denetim sinyallerini üretmelerine olanak tanır. Örneğin, Doğal Dil İşleme (NLP) alanında, GPT-4 gibi modeller, cümlenin bir sonraki kelimesini tahmin etmek için büyük miktarda metin üzerinde önceden eğitilir ve böylece açık etiketler olmadan dilin yapısını etkili bir şekilde öğrenir.

Benzer şekilde, bilgisayar görme (CV) alanında da otomatik kodlayıcılar verimli veri kodlamalarını öğrenmek için kullanılır. Bu sinir ağları, görüntüleri daha düşük boyutlu bir temsile sıkıştırır ve ardından yeniden oluşturur. Bu süreç, ağa görsel verilerin en belirgin özelliklerini öğretir ve bu da görüntü gürültüsünün giderilmesi ve üretken modelleme gibi görevler için yararlıdır.

Eğitim için veri kümelerini yönetmek isteyenler için Ultralytics , veri dağılımlarını görselleştirmeye yarayan araçlar sunar. Bu araçlar, denetimli eğitim süreci başlamadan önce kümeleri veya anomalileri belirlemeye yardımcı olabilir. Denetimsiz keşif yoluyla verilerinizin yapısını anlamak, genellikle sağlam AI çözümleri oluşturmanın ilk adımıdır.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın