Sözlük

t-dağıtılmış Stokastik Komşu Gömme (t-SNE)

Yüksek boyutlu verileri görselleştirmek için güçlü bir teknik olan t-SNE'yi keşfedin. Yapay zeka ve makine öğrenimi alanındaki kullanımlarını, faydalarını ve uygulamalarını öğrenin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

t-dağıtılmış Stokastik Komşu Gömme (t-SNE), öncelikle yüksek boyutlu veri kümelerini düşük boyutlu bir uzayda, tipik olarak iki veya üç boyutta görselleştirmek için tasarlanmış, boyut azaltma için kullanılan güçlü bir tekniktir. Laurens van der Maaten ve Geoffrey Hinton tarafından geliştirilen t-SNE, kümeler ve manifoldlar gibi verilerin altında yatan yerel yapıyı ortaya çıkarmada başarılıdır. Bu, Yapay Zeka (AI) ve Makine Öğrenimi (ML) modelleri tarafından oluşturulan veya işlenen karmaşık veri kümelerinin görsel inceleme yoluyla yorumlanmasını kolaylaştırır. Bilgisayarla Görme (CV) ve Doğal Dil İşleme (NLP) dahil olmak üzere çeşitli alanlarda yaygın olarak kullanılmaktadır.

t-SNE Nasıl Çalışır?

t-SNE'nin arkasındaki temel fikir, yüksek boyutlu veri noktalarını, noktalar arasındaki benzerlikleri koruyacak şekilde düşük boyutlu bir uzaya (örneğin, 2 boyutlu bir grafik) eşlemektir. Yüksek boyutlu nokta çiftleri arasındaki benzerliği koşullu olasılıklar olarak modeller ve ardından eşlenen noktalar arasındaki koşullu olasılıkların benzer olduğu düşük boyutlu bir gömme bulmaya çalışır. Bu süreç yerel yapıyı korumaya odaklanır - yüksek boyutlu uzayda birbirine yakın olan noktalar düşük boyutlu haritada da birbirine yakın kalmalıdır.

Temel Bileşen Analizi (PCA) gibi doğrusal yöntemlerin aksine, t-SNE doğrusal değildir ve olasılıksaldır. Bu, PCA'nın gözden kaçırabileceği kavisli manifoldlar gibi karmaşık, doğrusal olmayan ilişkileri yakalamasını sağlar. Algoritma, yüksek boyutlu uzayda bir Gauss dağılımı ve düşük boyutlu uzayda bir Student t-dağılımı (bir serbestlik derecesi ile) kullanarak benzerlikleri hesaplar. T-dağılımını kullanmak, düşük boyutlu haritada birbirine benzemeyen noktaları birbirinden ayırmaya yardımcı olarak noktaların bir araya gelme eğiliminde olduğu "kalabalıklaşma sorununu" hafifletir. Optimum yerleştirme, gradyan inişi gibi optimizasyon teknikleri kullanılarak iki olasılık dağılımı arasındaki sapmanın (özellikle Kullback-Leibler sapması) en aza indirilmesiyle bulunur. Derinlemesine bir teknik anlayış için orijinal t-SNE makalesine bakın.

t-SNE vs. PCA

Hem t-SNE hem de PCA yaygın boyut azaltma teknikleri olsa da, önemli ölçüde farklılık gösterirler:

  • Doğrusallık: PCA doğrusal bir tekniktir, t-SNE ise doğrusal değildir. PCA varyansı maksimize eden temel bileşenleri bulur ve esasen verileri döndürür. t-SNE ise ikili benzerlikleri modeller.
  • Odak noktası: PCA, verilerdeki küresel yapıyı ve maksimum varyansı korumayı amaçlar. t-SNE, yerel yapıyı (noktaların komşulukları) korumaya öncelik verir.
  • Kullanım Örneği: PCA genellikle veri sıkıştırma, gürültü azaltma ve diğer ML algoritmalarını uygulamadan önce bir veri ön işleme adımı olarak kullanılır. t-SNE, kümeleri ortaya çıkarma yeteneği nedeniyle öncelikle veri görselleştirme ve keşif için kullanılır.
  • Yorumlanabilirlik: PCA grafiğindeki eksenler temel bileşenleri temsil eder ve varyansla ilgili net bir matematiksel yoruma sahiptir. Bir t-SNE grafiğindeki eksenler ve kümeler arasındaki mesafeler bu kadar doğrudan bir global yoruma sahip değildir; odak noktası noktaların göreceli gruplandırılmasıdır.

Yapay Zeka ve Makine Öğrenimi Uygulamaları

t-SNE, derin öğrenme modelleri tarafından öğrenilen gömülmeleri keşfetmek gibi yapay zeka ve makine öğrenimi işlem hatlarında sıklıkla karşılaşılan karmaşık, yüksek boyutlu verileri anlamak için paha biçilmez bir görselleştirme aracı olarak hizmet eder.

  • Görüntü Özelliklerini Görselleştirme: Bilgisayarla görmede t-SNE, Evrişimsel Sinir Ağları (CNN'ler) tarafından üretilen yüksek boyutlu özellik haritalarını veya katıştırmaları görselleştirebilir. Ultralytics YOLOnesne algılama veya görüntü sınıflandırma için kullanılan modeller. Araştırmacılar, ImageNet veya COCO gibi bir veri kümesinden çıkarılan özelliklere t-SNE uygulayarak, modelin benzer görüntüleri veya nesne sınıflarını özellik uzayında birlikte gruplamayı öğrenip öğrenmediğini görebilir ve modelin anlayışına ilişkin içgörüler sağlayabilir. Bu, standart doğruluk metriklerinin ötesinde model performansının analiz edilmesine yardımcı olur (bkz. YOLO Performans Metrikleri).
  • Kelime Gömülerini Keşfetmek: NLP'de t-SNE, kelime katıştırmalarını (örneğin Word2Vec, GloVe veya BERT'ten) 2D olarak görselleştirmek için kullanılır. Bu, anlamsal ilişkilerin incelenmesine olanak tanır; örneğin, "kral", "kraliçe", "prens" ve "prenses" gibi kelimeler farklı kümeler oluşturabilir veya dil modellemesinin kalitesini gösteren anlamlı göreceli konumlar sergileyebilir. TensorFlow or gibi araçlar görselleştirmeyi gömmek için genellikle t-SNE kullanır.
  • Eğitim Verilerini Anlama: Model eğitimi öncesinde veya sırasında, t-SNE, eğitim verilerinin yapısını görselleştirmeye yardımcı olabilir ve potansiyel olarak Ultralytics HUB gibi platformlar aracılığıyla yönetilen veri kümelerindeki farklı kümeleri, aykırı değerleri veya etiketleme sorunlarını ortaya çıkarabilir.

Dikkate Alınması Gerekenler

Görselleştirme için güçlü olsa da, t-SNE'nin bazı hususları vardır:

  • Hesaplama Maliyeti: İkili hesaplamalar nedeniyle çok büyük veri kümeleri için hesaplama açısından pahalı ve yavaş olabilir. t-SNE'ye yaklaşma veya önce PCA uygulama gibi teknikler yardımcı olabilir.
  • Hiperparametreler: Sonuçlar "perplexity" (dikkate alınan en yakın komşu sayısıyla ilgili) ve gradyan inişi için iterasyon sayısı gibi hiperparametreler konusunda hassas olabilir.
  • Küresel Yapı: t-SNE yerel yapıya odaklanır; nihai çizimdeki kümeler arasındaki göreceli mesafeler orijinal yüksek boyutlu uzaydaki ayrımı doğru bir şekilde yansıtmayabilir. Küme boyutları da yanıltıcı olabilir. Scikit-learn gibi kütüphanelerde ve aşağıdaki gibi çerçevelerde uygulamalar mevcuttur PyTorch.
Tümünü okuyun