Descobre como a aprendizagem não supervisionada utiliza o agrupamento, a redução da dimensionalidade e a deteção de anomalias para descobrir padrões ocultos nos dados.
A aprendizagem não supervisionada é uma categoria de aprendizagem automática (ML) em que os algoritmos são treinados em dados que não têm etiquetas ou categorias predefinidas. Ao contrário da aprendizagem supervisionada, o objetivo não é prever um resultado conhecido com base nas caraterísticas de entrada. Em vez disso, o sistema tenta aprender sozinho a estrutura, os padrões e as relações subjacentes nos dados. É como dar a um computador uma grande coleção de itens não ordenados e pedir-lhe que encontre agrupamentos naturais ou caraterísticas interessantes sem lhe dizer o que procurar. Esta abordagem é crucial para explorar conjuntos de dados complexos e descobrir conhecimentos que podem não ser aparentes de antemão, constituindo uma parte fundamental da Inteligência Artificial (IA) moderna.
Na aprendizagem não supervisionada, o algoritmo examina os pontos de dados de entrada e tenta identificar semelhanças, diferenças ou correlações entre eles. Não existem respostas "corretas" ou resultados-alvo fornecidos durante a fase de formação. Os algoritmos devem inferir a estrutura inerente presente nos dados. Isto envolve frequentemente a organização dos pontos de dados em grupos(agrupamento), a redução da complexidade dos dados(redução da dimensionalidade) ou a identificação de pontos de dados invulgares(deteção de anomalias). O sucesso dos métodos não supervisionados depende frequentemente da capacidade do algoritmo para captar as propriedades intrínsecas do conjunto de dados sem orientação externa.
Várias técnicas são abrangidas pelo conceito de aprendizagem não supervisionada:
A aprendizagem não supervisionada potencia várias aplicações em diferentes domínios:
A aprendizagem não supervisionada difere significativamente de outras abordagens de ML:
A aprendizagem não supervisionada é uma ferramenta poderosa para explorar dados, descobrir estruturas ocultas e extrair caraterísticas valiosas, servindo frequentemente como um primeiro passo crítico em condutas de análise de dados complexos ou complementando outras técnicas de ML. Plataformas como o Ultralytics HUB fornecem ambientes onde vários modelos de ML, potencialmente incorporando técnicas não supervisionadas para preparação ou análise de dados, podem ser desenvolvidos e geridos. Estruturas como o PyTorch e TensorFlow oferecem bibliotecas extensas que suportam a implementação de algoritmos não supervisionados.