Glossário

Aprendizagem não supervisionada

Explora a aprendizagem não supervisionada para descobrir padrões de dados ocultos. Descobre K-Means, DBSCAN, PCA, t-SNE e aplicações do mundo real hoje mesmo!

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A aprendizagem não supervisionada é um tipo de aprendizagem automática que utiliza algoritmos para analisar e agrupar conjuntos de dados não rotulados. Estes algoritmos descobrem padrões ocultos ou agrupamentos de dados sem conhecimento prévio ou dados de treino. Ao contrário da aprendizagem supervisionada, que se baseia em dados rotulados para prever resultados, a aprendizagem não supervisionada procura compreender a estrutura subjacente dos dados. Isto pode ser particularmente útil em cenários em que a rotulagem humana é impraticável, tornando-a uma pedra angular para explorar a investigação e a análise baseadas em dados.

Conceitos-chave

Na aprendizagem não supervisionada, as técnicas mais utilizadas são o agrupamento e a redução da dimensionalidade. O agrupamento envolve o agrupamento de pontos de dados semelhantes entre si, enquanto a redução da dimensionalidade simplifica os dados reduzindo o número de variáveis aleatórias em consideração.

Técnicas de agrupamento

  1. Agrupamento K-Means:

    O K-Means é um algoritmo de agrupamento popular que divide os dados em K clusters distintos com base na semelhança de caraterísticas. Ajusta iterativamente os centróides dos agrupamentos, minimizando a variância dentro de cada agrupamento. É amplamente utilizado na segmentação de clientes e na pesquisa de mercado. Saiba mais sobre o K-Means.

  2. DBSCAN:

    DBSCAN (Density-Based Spatial Clustering of Applications with Noise) identifica amostras centrais de alta densidade e expande os clusters a partir delas. Trabalha bem com estruturas de dados complexas e é útil em aplicações em que as distribuições de classe são desconhecidas. Explora o DBSCAN.

Redução da dimensionalidade

  1. Análise de componentes principais (PCA):

    A PCA é um método utilizado para realçar a variação e destacar padrões fortes num conjunto de dados. Reduz a dimensionalidade de grandes conjuntos de dados, transformando-os num novo conjunto de variáveis. A PCA é muito útil na compressão de imagens e na redução de ruído. Explora a PCA.

  2. t-Distributed Stochastic Neighbor Embedding (t-SNE):

    O t-SNE é uma técnica para visualizar dados de elevada dimensão, atribuindo a cada ponto de dados uma localização num mapa bi ou tridimensional. É excelente para visualizar conjuntos de dados complexos com muitas caraterísticas. Saiba mais sobre o t-SNE.

Aplicações no mundo real

1. Segmentação do mercado

As empresas utilizam frequentemente a aprendizagem não supervisionada para a segmentação do mercado, a fim de identificar segmentos de clientes distintos com base no comportamento de compra. Isto melhora as estratégias de marketing direcionadas e o posicionamento do produto.

2. Deteção de anomalias

Na cibersegurança, os algoritmos de aprendizagem não supervisionada são utilizados para detetar padrões invulgares ou anomalias no tráfego de rede, que podem significar potenciais ameaças à segurança. Explora as técnicas de deteção de anomalias.

Diferenças em relação a conceitos relacionados

  • Aprendizagem supervisionada: Ao contrário da aprendizagem não supervisionada, a aprendizagem supervisionada requer dados rotulados para prever resultados. Lê mais sobre a aprendizagem supervisionada.

  • Aprendizagem semi-supervisionada: Combina uma pequena quantidade de dados etiquetados com uma grande quantidade de dados não etiquetados, situando-se entre a aprendizagem supervisionada e não supervisionada. Aprende sobre a aprendizagem semi-supervisionada.

Benefícios e desafios

Benefícios

  • Exploração de dados: Permite a exploração da estrutura de dados sem rótulos pré-definidos, revelando tendências e padrões.
  • Escalabilidade: Consegue lidar eficientemente com grandes volumes de dados.

Desafios

  • Interpretabilidade: Os resultados do modelo podem, por vezes, ser difíceis de interpretar.
  • Avaliação: Não existe uma forma direta de avaliar os modelos, uma vez que não existem rótulos.

Conclusão

A aprendizagem não supervisionada desempenha um papel vital na análise e descoberta de dados modernos. Desde a melhoria das experiências dos clientes com a personalização até à melhoria da segurança com a deteção de anomalias, as suas aplicações são amplas e variadas. Ultralytics continua a explorar o potencial positivo da IA através de técnicas de aprendizagem robustas como estas, permitindo que as empresas e os investigadores aproveitem todo o poder dos dados. Explora a missão e as soluções do Ultralytics para veres como as ferramentas de IA estão a ser desenvolvidas para aplicações com impacto.

Lê tudo