Sözlük

t-dağıtılmış Stokastik Komşu Gömme (t-SNE)

Yüksek boyutlu verileri görselleştirmek için güçlü bir teknik olan t-SNE'yi keşfedin. Yapay zeka ve makine öğrenimi alanındaki kullanımlarını, faydalarını ve uygulamalarını öğrenin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

t-dağıtılmış Stokastik Komşu Gömme (t-SNE), öncelikle yüksek boyutlu verileri düşük boyutlu bir uzayda, tipik olarak iki veya üç boyutta görselleştirmek için kullanılan güçlü bir boyutsallık azaltma tekniğidir. Verilerin yerel yapısını ortaya çıkarmada özellikle etkilidir, bu da onu sezgisel görsel temsiller aracılığıyla karmaşık veri kümelerini anlamak için makine öğrenimi ve veri analizinde değerli bir araç haline getirir.

t-SNE'yi Anlamak

Özünde t-SNE, orijinal verilerin ikili benzerliklerini mümkün olduğunca korurken yüksek boyutlu veri noktalarını daha düşük bir boyuta eşlemek için tasarlanmıştır. Temel Bileşen Analizi (PCA) gibi doğrusal boyut azaltma tekniklerinin aksine, t-SNE doğrusal değildir ve doğrusal yöntemlerin gözden kaçırabileceği karmaşık ilişkileri ve kalıpları yakalamasına olanak tanır. Bu doğrusal olmama özelliği, ilişkilerin genellikle kavisli veya manifold benzeri olduğu karmaşık, gerçek dünya veri kümelerini ele almada özellikle becerikli olmasını sağlar.

Algoritma, ilk olarak benzerlikleri temsil etmek için yüksek boyutlu veri noktaları çiftleri üzerinde bir olasılık dağılımı oluşturarak çalışır. Daha sonra düşük boyutlu haritadaki noktalar üzerinde benzer bir olasılık dağılımı tanımlar. t-SNE'nin amacı, bu iki dağılım arasındaki farklılığı en aza indirerek ideal olarak orijinal verinin yapısını, özellikle de yerel komşuluklarını yansıtan düşük boyutlu bir harita elde etmektir. Bu süreç, olasılık ve gradyan iniş optimizasyonu kavramlarını kullanan karmaşık hesaplamalar içerir. Daha derin bir teknik inceleme için van der Maaten ve Hinton (2008) tarafından yazılan orijinal t-SNE makalesine başvurabilirsiniz.

Yapay Zeka ve Makine Öğrenimi Uygulamaları

t-SNE, karmaşık veri kümelerini görselleştirmedeki etkinliği nedeniyle Yapay Zeka ve Makine Öğrenimi dahilindeki çeşitli alanlarda yaygın olarak kullanılmaktadır. İşte birkaç somut örnek:

  • Tıbbi Görüntü Analizi: Tıbbi görüntü analizinde t-SNE, MRI veya CT taramaları gibi tıbbi görüntülerden çıkarılan yüksek boyutlu özellik vektörlerini görselleştirmek için kullanılabilir. Örneğin, beyin tümörü tespitinde, farklı ilgi alanlarından gelen özellikler t-SNE kullanılarak iki boyuta indirgenebilir ve araştırmacıların ve klinisyenlerin farklı tümör tiplerine veya aşamalarına karşılık gelebilecek benzer görüntü özelliklerinin kümelerini görsel olarak tanımlamasına olanak tanır. Bu görsel kümeleme, hastalık modellerinin teşhisine ve anlaşılmasına yardımcı olabilir ve potansiyel olarak yapay zeka güdümlü teşhis araçlarının doğruluğunu artırabilir.
  • DoğalDil İşleme(NLP): Doğal Dil İşleme'de (NLP), t-SNE kelime gömülerini görselleştirmek için çok değerlidir. Kelime gömüleri, anlamsal ilişkileri yakalayan kelimelerin yüksek boyutlu vektör temsilleridir. Bu katıştırmalara t-SNE uygulayarak, bunları 2D veya 3D bir uzaya yansıtabilir ve anlamsal olarak benzer kelimelerin nasıl bir araya geldiğini gözlemleyebilirsiniz. Örneğin, "kral", "kraliçe", "prens" ve "prenses" gibi kelimeler bir küme oluştururken, hava durumu veya yemekle ilgili kelimeler ayrı kümeler oluşturabilir. Bu görselleştirme, BERT veya GPT gibi modeller tarafından oluşturulan kelime yerleştirmelerinin kalitesini ve yapısını anlamaya yardımcı olur ve genellikle anlamsal arama uygulamalarında kullanılır.

Önemli Hususlar

t-SNE güçlü bir araç olsa da, özelliklerinin ve sınırlamalarının farkında olmak önemlidir:

  • Hesaplama Maliyeti: t-SNE, karmaşıklığı veri noktası sayısıyla kuadratik olarak ölçeklendiğinden, özellikle çok büyük veri kümeleri için hesaplama açısından yoğun olabilir. Büyük ölçekli uygulamalar için, t-SNE'yi hızlandırmak veya verilerinizin temsili bir alt kümesinde kullanmak için yöntemler düşünün.
  • Yorumlama: t-SNE yerel yapıyı ve kümeleri ortaya çıkarmada başarılı olsa da, bir t-SNE grafiğindeki küresel mesafeler orijinal yüksek boyutlu uzaydaki küresel mesafeleri doğru bir şekilde yansıtmayabilir. Uzak noktalar arasındaki kesin mesafeler yerine kümeleri ve komşulukları yorumlamaya odaklanın.
  • Karmaşıklık: t-SNE, ortaya çıkan görselleştirmeyi etkileyen 'karmaşıklık' adlı bir parametreye sahiptir. Olasılık dağılımları oluşturulurken dikkate alınan en yakın komşu sayısını kabaca kontrol eder. Perplexity'nin hiperparametre ayarı görselleştirmeyi önemli ölçüde etkileyebilir ve belirli bir veri kümesi için en bilgilendirici görselleştirmeyi bulmak için genellikle farklı perplexity değerleri ile deneme yapılması önerilir. Python adresindeki scikit-learn gibi araçlar, t-SNE'nin ayarlanabilir perplexity ve diğer parametrelerle uygulanmasını sağlar.

Özetle, t-SNE, özellikle yerel veri yapısını ve küme modellerini anlamanın çeşitli yapay zeka ve bilgisayarla görme uygulamalarında çok önemli olduğu durumlarda, yüksek boyutlu verileri görselleştirmek için önemli bir boyutsallık azaltma tekniğidir.

Tümünü okuyun