Descobre como a aprendizagem não supervisionada utiliza o agrupamento, a redução da dimensionalidade e a deteção de anomalias para descobrir padrões ocultos nos dados.
A aprendizagem não supervisionada é um tipo de aprendizagem automática (ML) em que os algoritmos aprendem padrões a partir de dados não rotulados. Ao contrário da aprendizagem supervisionada, que se baseia em etiquetas predefinidas ou "respostas corretas", os métodos não supervisionados exploram a estrutura inerente dos dados para descobrir relações ocultas, agrupamentos ou anomalias sem orientação prévia. Esta abordagem é particularmente útil na Inteligência Artificial (IA) para a exploração inicial de dados e para a compreensão de conjuntos de dados complexos em que a rotulagem é impraticável ou impossível. Permite que os modelos descubram padrões e conhecimentos diretamente a partir dos dados.
O principal objetivo da aprendizagem não supervisionada é modelar a estrutura ou distribuição subjacente nos dados para aprender mais sobre eles. Os algoritmos são deixados a descobrir semelhanças, diferenças e estruturas por si próprios. As técnicas mais comuns incluem:
As técnicas de aprendizagem não supervisionada são utilizadas em vários cenários do mundo real, especialmente quando se lida com grandes volumes de dados não rotulados:
A aprendizagem não supervisionada desempenha um papel crucial na compreensão das vastas quantidades de dados brutos e não rotulados caraterísticos do Big Data. Funciona frequentemente como um passo essencial no pré-processamento de dados e na engenharia de caraterísticas, ajudando a descobrir estruturas ocultas ou a reduzir a complexidade dos dados antes de aplicar outras técnicas de ML. Embora modelos como o Ultralytics YOLO sejam treinados principalmente com métodos supervisionados para tarefas como a deteção de objectos, a compreensão das estruturas de dados através de métodos não supervisionados pode ajudar significativamente na preparação e análise do conjunto de dados, melhorando potencialmente o desempenho do modelo. Podes explorar os guias de recolha e anotação de dados para preparar conjuntos de dados e gerir os teus dados e modelos utilizando plataformas como o Ultralytics HUB.
É importante distinguir a aprendizagem não supervisionada dos paradigmas relacionados com a aprendizagem profunda (DL) e o ML:
A aprendizagem não supervisionada continua a ser uma área fundamental do ML, impulsionando a descoberta e a compreensão de conjuntos de dados complexos em que as etiquetas são escassas ou não estão disponíveis.