用語集

t分散確率的近傍埋め込み(t-SNE)

t-SNEで高次元データを簡単に可視化。今すぐパターンを発見し、クラスターを探索し、機械学習の洞察を強化しましょう!

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

t-distributed Stochastic Neighbor Embedding (t-SNE)は、機械学習において、高次元データを低次元空間(通常は2次元または3次元)で可視化するために用いられる強力な手法である。この手法は、元の高次元空間では明らかにならないような根本的なパターンや構造を明らかにすることで、複雑なデータセットを探索し理解するのに特に効果的である。データポイント間の局所的な関係を保持したまま次元を削減することで、t-SNEは直感的な可視化と分析を可能にし、探索的データ分析や機械学習ワークフローにおける貴重なツールとなる。

t-SNEの仕組み

t-SNEは、高次元オブジェクトのペアに対して、類似オブジェクトはより高い確率が割り当てられ、非類似オブジェクトはより低い確率が割り当てられるような確率分布を構築することによって動作する。そして、低次元マップの点上の同様の確率分布を定義し、マップの点の位置に関して2つの分布間のカルバック・ライブラー発散を最小化する。この方法は局所近傍を保存するように設計されている。つまり、高次元空間で近くにある点は、低次元表現でも近くにある傾向があるということである。

次元削減の関連概念と、それが機械学習をどのように支援するかについて、さらに詳しく学びましょう。

他の手法との主な違い

t-SNEは次元削減手法であるが、主成分分析(PCA)のような他の手法とは大きく異なる。PCAは分散を最大化することでデータの大域的な構造を保持することに重点を置くが、t-SNEは局所的な近傍領域を保持することに重点を置く。この違いにより、t-SNEはクラスターを可視化し、データ内の隠れた構造を明らかにするのに特に有用である。もう1つの関連技法はK-Meansクラスタリングで、これはデータをクラスタに分割するのに使われる。どちらも一緒に使うことができるが、t-SNEは主に可視化ツールであり、K-Meansはクラスタリング・アルゴリズムである。

実世界での応用

ゲノム解析

バイオインフォマティクスにおいて、t-SNEは複雑なゲノムデータの可視化に広く用いられている。例えば、単一細胞のRNAシーケンスデータから異なる細胞集団を特定するのに役立ちます。高次元の遺伝子発現プロファイルを2次元マップに縮小することで、t-SNEは類似の発現パターンを持つ細胞のクラスターを明らかにすることができ、新しい細胞タイプや状態の発見に役立つ。

機械学習によるゲノム解析へのAIの影響を探る。

画像認識

t-SNEは、ディープラーニングモデルが学習した特徴空間を可視化するために、画像認識にも応用できる。例えば、画像分類のためにCNN(Convolutional Neural Network:畳み込みニューラルネットワーク)を学習する場合、t-SNEを使用して、ネットワークが特徴空間内の異なるクラスをどのように分離するかを可視化することができる。これはモデルの意思決定プロセスに対する洞察を提供し、改善の可能性のある領域を特定するのに役立ちます。

高度な画像検出システムに Ultralytics YOLO高度な画像検出システムに

テクニカル・インサイト

t-SNEは確率過程、つまりランダム性を利用して結果を得る。このアルゴリズムは、ガウス分布を用いて高次元空間におけるデータ点間の対類似度を計算することから始まる。次にこれらの点を低次元空間にマッピングし、t分布を用いて類似度を計算する。最適化プロセスは、2つの確率分布間の発散を最小化するように、低次元空間における点の位置を繰り返し調整する。

AI/MLでの使用

可視化だけでなく、t-SNEは深層学習モデルの特徴空間の構造に関する洞察を得るために使用することができる。t-SNEは、モデルが異なるクラスやカテゴリをどのように区別するかを理解する上で特に有用である。ニューラルネットワークの中間層を可視化することで、研究者はモデルの挙動を診断し、潜在的な問題を特定し、モデル・アーキテクチャを改良することができる。

AIにおける特徴抽出のテクニックとその意義について詳しく学ぶ。

結論

t-SNEは、機械学習において高次元データを可視化し解釈するための貴重なツールである。局所構造を保持するその能力は、複雑なデータセット内のクラスターやパターンを明らかにするのに特に効果的である。ゲノムデータの探索、深層学習モデルの理解、自然言語処理結果の可視化など、t-SNEはデータの根底にある構造への洞察を得るための強力な手段を提供する。

このような高度な技術を統合することで、Ultralytics'Vision AI Toolsがお客様のAIプロジェクトをさらに強化する方法をご覧ください。

すべて読む