Glossário

Redução da dimensionalidade

Melhora os modelos de IA dominando a redução da dimensionalidade. Simplifica, visualiza e acelera a computação com técnicas como PCA e t-SNE.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A redução da dimensionalidade é um conceito-chave na aprendizagem automática e na análise de dados, centrando-se na redução do número de variáveis aleatórias em consideração. Ajuda a simplificar os modelos, tornando-os mais fáceis de interpretar e mais eficientes no processamento. Esta técnica é essencial no tratamento de conjuntos de dados de elevada dimensão, onde a existência de muitas caraterísticas pode levar a desafios como o sobreajuste, o aumento dos custos computacionais e a dificuldade de visualização.

Porque é que a redução da dimensionalidade é importante

No mundo da Inteligência Artificial (IA) e da Aprendizagem Automática (AM), a redução da dimensionalidade desempenha um papel fundamental. Ao reduzir o número de variáveis de entrada, ajuda a:

  • Melhorar o desempenho do modelo: Simplifica os modelos removendo o ruído e os dados redundantes.
  • Melhora a visualização: Facilita a apresentação de dados em duas ou três dimensões, facilitando a obtenção de melhores conhecimentos.
  • Acelera a computação: Diminui a carga computacional dos algoritmos, o que é vital em ambientes com recursos limitados.

Técnicas de redução de dimensionalidade

Várias técnicas podem ser aplicadas para a redução da dimensionalidade:

  • Análise de componentes principais (PCA): A PCA é uma das técnicas mais utilizadas que transforma os dados num conjunto de variáveis linearmente não correlacionadas denominadas componentes principais. Mantém a maior parte da variabilidade presente no conjunto de dados com menos dimensões. Sabe mais sobre PCA.
  • t-Distributed Stochastic Neighbor Embedding (t-SNE): Uma técnica não linear frequentemente utilizada para visualização de dados em 2D ou 3D. Concentra-se em preservar a estrutura local dos dados. Descobre o t-SNE.

  • Autoencodificadores: Um tipo de rede neural utilizada para aprender codificações eficientes dos dados de entrada. São utilizados principalmente em contextos de aprendizagem profunda para redução da dimensionalidade.

Aplicações no mundo real

Compressão de imagens

Na visão computacional, a redução da dimensionalidade ajuda a comprimir os dados da imagem. Modelos como o Ultralytics YOLO utilizam dados de imagem que são frequentemente reduzidos em termos de dimensionalidade para melhorar os tempos de processamento sem comprometer significativamente a precisão. Lê sobre aplicações na visão por computador.

Genómica

A redução da dimensionalidade é utilizada na genómica para analisar grandes conjuntos de dados com milhões de marcadores genéticos. Ao reduzir a dimensionalidade, é possível concentrar-se em variações significativas que afectam as funções biológicas, tornando-a essencial para campos como a medicina personalizada.

Distinções de conceitos relacionados

Enquanto a redução da dimensionalidade reduz as caraterísticas de entrada de dados, difere de:

  • Engenharia de caraterísticas: Este processo envolve a criação de novas caraterísticas com base nas existentes, enquanto que a redução da dimensionalidade reduz normalmente a contagem de caraterísticas. Sabe mais sobre a engenharia de caraterísticas.

  • Seleção de caraterísticas: Ao contrário da redução da dimensionalidade, a seleção de caraterísticas envolve a seleção de um subconjunto das caraterísticas originais sem as transformar.

Desafios e considerações

Embora benéfica, a redução da dimensionalidade pode levar à perda de informação. É vital equilibrar a redução de dimensões e a retenção de informações cruciais. Também é importante escolher a técnica correta tendo em conta o conjunto de dados e o resultado pretendido.

Integração com ferramentas

Para os profissionais, a utilização de plataformas como o Ultralytics HUB pode facilitar a redução da dimensionalidade, juntamente com a formação e a implementação de modelos, proporcionando um fluxo de trabalho contínuo aos cientistas e engenheiros de dados.

A redução da dimensionalidade é uma ferramenta poderosa na caixa de ferramentas da aprendizagem automática, que ajuda a lidar com a complexidade e os desafios computacionais, ao mesmo tempo que permite uma visão mais clara e um melhor desempenho do modelo. A sua integração nos processos de IA e ML continua a expandir-se, oferecendo abordagens simplificadas aos desafios dos grandes volumes de dados.

Lê tudo