Glossário

Incorporação de vizinhos estocásticos t-distribuídos (t-SNE)

Explora o t-SNE, uma técnica poderosa para visualizar dados de alta dimensão. Aprende as suas utilizações, vantagens e aplicações em IA e ML.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

O t-distributed Stochastic Neighbor Embedding (t-SNE) é uma técnica popular utilizada para a redução da dimensionalidade, particularmente adequada para a visualização de conjuntos de dados de elevada dimensão num espaço de baixa dimensão, normalmente de duas ou três dimensões. Desenvolvida por Laurens van der Maaten e Geoffrey Hinton, destaca-se por revelar a estrutura subjacente dos dados, como clusters e manifolds, tornando os dados complexos mais fáceis de compreender através de inspeção visual. É amplamente utilizada nos domínios da aprendizagem automática (ML) e da análise de dados.

Compreender a t-SNE

A ideia central do t-SNE é preservar a estrutura local dos dados. Modela a semelhança entre pontos de dados de alta dimensão como probabilidades condicionais e, em seguida, tenta encontrar uma incorporação de baixa dimensão que produza uma distribuição de probabilidade semelhante entre os pontos mapeados. Ao contrário dos métodos lineares, como a análise de componentes principais (PCA), a t-SNE é não linear e probabilística. Isto permite-lhe captar relações complexas que a PCA pode não captar, especialmente quando os dados se encontram em variedades curvas. No entanto, a PCA é melhor para preservar a estrutura global e a variância dos dados.

O algoritmo calcula as semelhanças de pares entre pontos em dimensões altas e baixas. Utiliza uma distribuição Gaussiana no espaço de alta dimensão e uma distribuição t (especificamente, uma distribuição t de Student com um grau de liberdade) no espaço de baixa dimensão. A utilização da distribuição t ajuda a aliviar o "problema de aglomeração" (em que os pontos tendem a aglomerar-se no centro do mapa) e separa mais eficazmente os pontos diferentes no mapa de baixa dimensão. O processo envolve a minimização da divergência entre estas duas distribuições utilizando a descida do gradiente. Para uma explicação técnica detalhada, consulta o artigo original sobre t-SNE.

Aplicações em IA e ML

O t-SNE é principalmente uma técnica de visualização, de valor inestimável para explorar e compreender dados de elevada dimensão gerados por modelos de IA. Aqui tens alguns exemplos:

Considerações fundamentais

Embora poderoso, o t-SNE tem caraterísticas que os utilizadores devem compreender:

  • Custo computacional: O t-SNE pode ser computacionalmente intensivo, especialmente para conjuntos de dados muito grandes, uma vez que requer o cálculo de semelhanças entre pares.
  • Sensibilidade dos hiperparâmetros: Os resultados são sensíveis aos hiperparâmetros, nomeadamente à "perplexidade", que influencia o número de vizinhos locais considerados para cada ponto. É muitas vezes necessário afinar corretamente os hiperparâmetros. Implementações como a do scikit-learn oferecem controlos para estes parâmetros.
  • Interpretação: As dimensões dos clusters e as distâncias entre eles no gráfico t-SNE nem sempre correspondem diretamente às dimensões ou separações reais dos clusters no espaço original de elevada dimensão. Revela principalmente semelhanças e agrupamentos locais. É uma ferramenta para exploração em vez de uma análise de agrupamento definitiva como o K-Means.

Em resumo, o t-SNE é uma ferramenta valiosa no conjunto de ferramentas da Inteligência Artificial (IA) para visualizar e obter intuição sobre conjuntos de dados complexos e de elevada dimensão, complementando outros métodos analíticos.

Lê tudo