Glossário

Aprendizagem não supervisionada

Descobre como a aprendizagem não supervisionada utiliza o agrupamento, a redução da dimensionalidade e a deteção de anomalias para descobrir padrões ocultos nos dados.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A aprendizagem não supervisionada é um tipo de aprendizagem automática (ML) em que os algoritmos aprendem padrões a partir de dados não rotulados. Ao contrário da aprendizagem supervisionada, que se baseia em etiquetas predefinidas ou "respostas corretas", os métodos não supervisionados exploram a estrutura inerente dos dados para descobrir relações ocultas, agrupamentos ou anomalias sem orientação prévia. Esta abordagem é particularmente útil na Inteligência Artificial (IA) para a exploração inicial de dados e para a compreensão de conjuntos de dados complexos em que a rotulagem é impraticável ou impossível. Permite que os modelos descubram padrões e conhecimentos diretamente a partir dos dados.

Como funciona a aprendizagem não supervisionada

O principal objetivo da aprendizagem não supervisionada é modelar a estrutura ou distribuição subjacente nos dados para aprender mais sobre eles. Os algoritmos são deixados a descobrir semelhanças, diferenças e estruturas por si próprios. As técnicas mais comuns incluem:

  • Agrupamento: Agrupa automaticamente pontos de dados semelhantes com base em determinadas caraterísticas. Os algoritmos mais populares incluem o K-Means Clustering e o DBSCAN.
  • Redução da dimensionalidade: Esta técnica simplifica os dados reduzindo o número de variáveis de entrada ou caraterísticas, preservando a informação essencial. A análise de componentes principais (PCA) é um método amplamente utilizado para a redução da dimensionalidade.
  • Aprendizagem de regras de associação: Este método descobre relações interessantes ou regras de associação entre variáveis em grandes conjuntos de dados. É normalmente aplicado na análise de cestos de compras para encontrar artigos frequentemente comprados em conjunto.

Aplicações da aprendizagem não supervisionada

As técnicas de aprendizagem não supervisionada são utilizadas em vários cenários do mundo real, especialmente quando se lida com grandes volumes de dados não rotulados:

  • Segmentação de clientes: As empresas utilizam o clustering para agrupar clientes com comportamentos, preferências ou dados demográficos semelhantes. Isto permite campanhas de marketing direcionadas mais eficazes e experiências de cliente personalizadas. Sabe mais sobre a segmentação de clientes.
  • Deteção de anomalias: Os algoritmos não supervisionados são excelentes na identificação de pontos de dados invulgares ou de anomalias que se desviam significativamente da norma. Isto é fundamental para aplicações como a deteção de fraudes nas finanças, a deteção de intrusões na rede ou a identificação de defeitos no fabrico.

Relevância em IA e ML

A aprendizagem não supervisionada desempenha um papel crucial na compreensão das vastas quantidades de dados brutos e não rotulados caraterísticos do Big Data. Funciona frequentemente como um passo essencial no pré-processamento de dados e na engenharia de caraterísticas, ajudando a descobrir estruturas ocultas ou a reduzir a complexidade dos dados antes de aplicar outras técnicas de ML. Embora modelos como o Ultralytics YOLO sejam treinados principalmente com métodos supervisionados para tarefas como a deteção de objectos, a compreensão das estruturas de dados através de métodos não supervisionados pode ajudar significativamente na preparação e análise do conjunto de dados, melhorando potencialmente o desempenho do modelo. Podes explorar os guias de recolha e anotação de dados para preparar conjuntos de dados e gerir os teus dados e modelos utilizando plataformas como o Ultralytics HUB.

Aprendizagem não supervisionada vs. outros tipos de aprendizagem

É importante distinguir a aprendizagem não supervisionada dos paradigmas relacionados com a aprendizagem profunda (DL) e o ML:

  • Aprendizagem supervisionada: Requer um conjunto de dados totalmente rotulado, o que significa que cada ponto de dados tem uma saída ou categoria conhecida. O objetivo é treinar um modelo que possa prever com precisão o resultado de novos pontos de dados não vistos, com base nos exemplos identificados.
  • Aprendizagem auto-supervisionada: Muitas vezes considerado um tipo de aprendizagem não supervisionada, gera automaticamente rótulos a partir dos próprios dados de entrada, criando tarefas pré-textuais (por exemplo, prever uma parte oculta de uma imagem). É amplamente utilizado para pré-treinar modelos grandes, incluindo os baseados na arquitetura Transformer.
  • Aprendizagem semi-supervisionada: Usa uma combinação de uma pequena quantidade de dados rotulados e uma grande quantidade de dados não rotulados. Esta abordagem visa aproveitar os dados não rotulados para melhorar a precisão da aprendizagem para além do que seria possível apenas com os dados rotulados limitados. Explora mais a aprendizagem semi-supervisionada.

A aprendizagem não supervisionada continua a ser uma área fundamental do ML, impulsionando a descoberta e a compreensão de conjuntos de dados complexos em que as etiquetas são escassas ou não estão disponíveis.

Lê tudo