Glossário

Aprendizagem não supervisionada

Descobre como a aprendizagem não supervisionada utiliza o agrupamento, a redução da dimensionalidade e a deteção de anomalias para descobrir padrões ocultos nos dados.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A aprendizagem não supervisionada é uma categoria de aprendizagem automática (ML) em que os algoritmos são treinados em dados que não têm etiquetas ou categorias predefinidas. Ao contrário da aprendizagem supervisionada, o objetivo não é prever um resultado conhecido com base nas caraterísticas de entrada. Em vez disso, o sistema tenta aprender sozinho a estrutura, os padrões e as relações subjacentes nos dados. É como dar a um computador uma grande coleção de itens não ordenados e pedir-lhe que encontre agrupamentos naturais ou caraterísticas interessantes sem lhe dizer o que procurar. Esta abordagem é crucial para explorar conjuntos de dados complexos e descobrir conhecimentos que podem não ser aparentes de antemão, constituindo uma parte fundamental da Inteligência Artificial (IA) moderna.

Como funciona a aprendizagem não supervisionada

Na aprendizagem não supervisionada, o algoritmo examina os pontos de dados de entrada e tenta identificar semelhanças, diferenças ou correlações entre eles. Não existem respostas "corretas" ou resultados-alvo fornecidos durante a fase de formação. Os algoritmos devem inferir a estrutura inerente presente nos dados. Isto envolve frequentemente a organização dos pontos de dados em grupos(agrupamento), a redução da complexidade dos dados(redução da dimensionalidade) ou a identificação de pontos de dados invulgares(deteção de anomalias). O sucesso dos métodos não supervisionados depende frequentemente da capacidade do algoritmo para captar as propriedades intrínsecas do conjunto de dados sem orientação externa.

Principais técnicas e conceitos

Várias técnicas são abrangidas pelo conceito de aprendizagem não supervisionada:

  • Agrupamento: Envolve o agrupamento de pontos de dados semelhantes com base em determinadas caraterísticas. O objetivo é criar clusters em que os itens dentro de um cluster são muito semelhantes e os itens em diferentes clusters são diferentes. Os algoritmos mais comuns incluem K-Means Clustering e DBSCAN. Isto é útil para tarefas como a segmentação de clientes ou a organização de grandes colecções de documentos.
  • Redução da dimensionalidade: Estas técnicas visam reduzir o número de variáveis de entrada (caraterísticas) num conjunto de dados, preservando a informação essencial. Isto simplifica os modelos, reduz o custo computacional e pode ajudar na visualização dos dados. Os métodos mais populares incluem a análise de componentes principais (PCA) e a incorporação de vizinhos estocásticos t-distribuídos (t-SNE).
  • Aprendizagem de regras de associação: Descobre relações interessantes ou regras de associação entre variáveis em grandes conjuntos de dados. Um exemplo clássico é a análise do cabaz de compras, que identifica os artigos frequentemente comprados em conjunto. Algoritmos como o Apriori são normalmente utilizados neste caso. Sabe mais sobre a extração de regras de associação.
  • Deteção de anomalias: Esta técnica centra-se na identificação de pontos de dados que se desviam significativamente da maioria dos dados. É amplamente utilizada para a deteção de fraudes, segurança de redes e identificação de defeitos no fabrico.
  • Modelos generativos: Alguns modelos não supervisionados, como as Redes Adversárias Generativas (GANs) ou os Autoencoders, podem aprender a distribuição de dados subjacente para gerar novas amostras de dados que se assemelham aos dados originais.

Aplicações no mundo real

A aprendizagem não supervisionada potencia várias aplicações em diferentes domínios:

Comparação com outros paradigmas de aprendizagem

A aprendizagem não supervisionada difere significativamente de outras abordagens de ML:

A aprendizagem não supervisionada é uma ferramenta poderosa para explorar dados, descobrir estruturas ocultas e extrair caraterísticas valiosas, servindo frequentemente como um primeiro passo crítico em condutas de análise de dados complexos ou complementando outras técnicas de ML. Plataformas como o Ultralytics HUB fornecem ambientes onde vários modelos de ML, potencialmente incorporando técnicas não supervisionadas para preparação ou análise de dados, podem ser desenvolvidos e geridos. Estruturas como o PyTorch e TensorFlow oferecem bibliotecas extensas que suportam a implementação de algoritmos não supervisionados.

Lê tudo