Sözlük

t-dağıtılmış Stokastik Komşu Gömme (t-SNE)

Yüksek boyutlu verileri görselleştirmek için güçlü bir teknik olan t-SNE'yi keşfedin. Yapay zeka ve makine öğrenimi alanındaki kullanımlarını, faydalarını ve uygulamalarını öğrenin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

t-dağıtılmış Stokastik Komşu Gömme (t-SNE), boyut azaltma için kullanılan popüler bir tekniktir ve özellikle yüksek boyutlu veri kümelerini düşük boyutlu uzayda, tipik olarak iki veya üç boyutta görselleştirmek için çok uygundur. Laurens van der Maaten ve Geoffrey Hinton tarafından geliştirilen bu teknik, kümeler ve manifoldlar gibi verilerin altında yatan yapıyı ortaya çıkararak karmaşık verilerin görsel inceleme yoluyla daha kolay anlaşılmasını sağlar. Makine öğrenimi (ML) ve veri analizi alanlarında yaygın olarak kullanılmaktadır.

t-SNE'yi Anlamak

t-SNE'nin arkasındaki temel fikir, verilerin yerel yapısını korumaktır. Yüksek boyutlu veri noktaları arasındaki benzerliği koşullu olasılıklar olarak modeller ve ardından eşlenen noktalar arasında benzer bir olasılık dağılımı üreten düşük boyutlu bir gömme bulmaya çalışır. Temel Bileşen Analizi (PCA) gibi doğrusal yöntemlerin aksine, t-SNE doğrusal değildir ve olasılıksaldır. Bu, özellikle veriler kavisli manifoldlar üzerinde yer aldığında PCA'nın gözden kaçırabileceği karmaşık ilişkileri yakalamasını sağlar. Bununla birlikte, PCA verilerin küresel yapısını ve varyansını korumada daha iyidir.

Algoritma, hem yüksek hem de düşük boyutlardaki noktalar arasındaki ikili benzerlikleri hesaplar. Yüksek boyutlu uzayda bir Gauss dağılımı ve düşük boyutlu uzayda bir t-dağılımı (özellikle, bir serbestlik derecesine sahip bir Student t-dağılımı) kullanır. T-dağılımının kullanılması "kalabalıklaşma sorununu" (noktaların haritanın merkezinde bir araya gelme eğiliminde olduğu) hafifletmeye yardımcı olur ve düşük boyutlu haritada birbirine benzemeyen noktaları daha etkili bir şekilde ayırır. Süreç, gradyan inişi kullanılarak bu iki dağılım arasındaki farklılığın en aza indirilmesini içerir. Detaylı teknik açıklama için orijinal t-SNE makalesine bakınız.

Yapay Zeka ve Makine Öğrenimi Uygulamaları

t-SNE öncelikle bir görselleştirme tekniğidir ve yapay zeka modelleri tarafından üretilen yüksek boyutlu verileri keşfetmek ve anlamak için çok değerlidir. İşte bazı örnekler:

Önemli Hususlar

Güçlü olmakla birlikte, t-SNE kullanıcıların anlaması gereken özelliklere sahiptir:

  • Hesaplama Maliyeti: t-SNE, ikili benzerliklerin hesaplanmasını gerektirdiğinden, özellikle çok büyük veri kümeleri için hesaplama açısından yoğun olabilir.
  • Hiperparametre Hassasiyeti: Sonuçlar hiper parametrelere, özellikle de her nokta için dikkate alınan yerel komşuların sayısını etkileyen "perplexity "ye duyarlıdır. Uygun hiperparametre ayarı genellikle gereklidir. Scikit-learn 'deki gibi uygulamalar bu parametreler için kontroller sunar.
  • Yorumlama: t-SNE grafiğindeki kümelerin boyutları ve aralarındaki mesafeler, orijinal yüksek boyutlu uzaydaki gerçek küme boyutlarına veya ayrımlara her zaman doğrudan karşılık gelmez. Öncelikle yerel benzerlikleri ve gruplaşmaları ortaya çıkarır. K-Means gibi kesin kümeleme analizinden ziyade keşif için bir araçtır.

Özetle, t-SNE, karmaşık, yüksek boyutlu veri kümelerini görselleştirmek ve bunlar hakkında sezgi kazanmak için Yapay Zeka (AI) araç setinde diğer analitik yöntemleri tamamlayan değerli bir araçtır.

Tümünü okuyun