Glossário

Aprendizagem supervisionada

Descobre como a aprendizagem supervisionada potencia a IA com dados rotulados, permitindo previsões precisas e aplicações como a deteção de objectos e a análise de sentimentos.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A aprendizagem supervisionada é uma categoria fundamental da aprendizagem automática (ML) em que os algoritmos aprendem a partir de um conjunto de dados que contém pares de entrada-saída, conhecidos como dados rotulados. Na sua essência, o algoritmo é "supervisionado" porque aprende comparando as suas previsões sobre os dados de entrada com as saídas corretas conhecidas (etiquetas) fornecidas nos dados de treino. O objetivo é que o algoritmo aprenda uma função de mapeamento que possa prever com precisão a saída para entradas novas e não vistas. Esta abordagem é fundamental para muitas aplicações modernas de Inteligência Artificial (IA), permitindo que os sistemas façam previsões ou tomem decisões com base em exemplos históricos.

Como funciona a aprendizagem supervisionada

O processo começa com um conjunto de dados em que cada ponto de dados consiste em caraterísticas de entrada e uma etiqueta de saída correta correspondente. Por exemplo, numa tarefa de classificação de imagens, as entradas seriam imagens e as etiquetas seriam as categorias a que pertencem (por exemplo, 'gato', 'cão'). O algoritmo faz iterativamente previsões sobre os dados de treino e ajusta os seus parâmetros internos utilizando um algoritmo de otimização como o gradient descent para minimizar a diferença entre as suas previsões e as etiquetas reais, medida por uma função de perda. Este treino continua até o modelo atingir um nível satisfatório de precisão nos dados de validação.

Relevância e aplicações

A aprendizagem supervisionada é incrivelmente versátil e permite uma vasta gama de aplicações em que os dados históricos podem prever acontecimentos futuros ou classificar novas informações. A sua capacidade de aprender diretamente a partir de exemplos rotulados torna-a adequada para tarefas que exigem elevada precisão. Muitas tarefas de visão por computador dependem fortemente da aprendizagem supervisionada, incluindo as realizadas por modelos como o Ultralytics YOLO.

Eis dois exemplos concretos:

  1. Análise de imagens médicas: Os modelos de aprendizagem supervisionada podem ser treinados em conjuntos de dados de exames médicos (como radiografias ou ressonâncias magnéticas) rotulados por radiologistas. Por exemplo, um modelo pode aprender a detetar tumores em imagens médicas ao ser treinado em imagens rotuladas como "tumor" ou "sem tumor". Isto ajuda os médicos no diagnóstico e no planeamento do tratamento, contribuindo significativamente para as soluções de IA nos cuidados de saúde.
  2. Análise de sentimentos: As empresas querem frequentemente compreender as opiniões dos clientes a partir de dados de texto, como críticas ou publicações nas redes sociais. Um modelo supervisionado pode ser treinado em exemplos de texto rotulados com sentimentos ("positivo", "negativo", "neutro"). Uma vez treinado, pode classificar automaticamente novo texto, fornecendo informações valiosas para pesquisa de mercado e atendimento ao cliente. Sabe mais sobre a análise de sentimentos.

Outras aplicações comuns incluem a deteção de objectos em imagens e vídeos (utilizada em veículos autónomos e sistemas de segurança), a filtragem de correio eletrónico não solicitado, a previsão dos preços da habitação( tarefa deregressão ) e o reconhecimento facial.

Conceitos-chave

Vários conceitos são fundamentais para compreender a aprendizagem supervisionada:

  • Dados rotulados: A base da aprendizagem supervisionada, que consiste em dados de entrada emparelhados com rótulos de saída corretos. A recolha e anotação de dados de alta qualidade são cruciais.
  • Caraterísticas: Variáveis de entrada mensuráveis ou caraterísticas utilizadas pelo modelo para fazer previsões. A engenharia de caraterísticas pode ter um impacto significativo no desempenho.
  • Rótulos (ou alvos): Os valores de saída corretos associados às caraterísticas de entrada nos dados de treino.
  • Classificação: Um tipo de tarefa de aprendizagem supervisionada em que o objetivo é prever uma etiqueta de categoria discreta (por exemplo, classificar e-mails como "spam" ou "não spam", ou imagens em diferentes classes utilizando modelos como o YOLO para classificação).
  • Regressão: Um tipo de tarefa de aprendizagem supervisionada em que o objetivo é prever um valor numérico contínuo (por exemplo, prever a temperatura, os preços das acções ou os valores das casas utilizando algoritmos como a regressão linear).
  • Algoritmos comuns: Inclui métodos como Regressão Logística, Máquinas de Vectores de Suporte (SVM), Árvores de Decisão, Florestas Aleatórias e vários tipos de Redes Neuronais (NN), particularmente Redes Neuronais Convolucionais (CNNs) para tarefas relacionadas com imagens, muitas vezes implementadas usando estruturas como PyTorch.

Comparação com outros paradigmas de aprendizagem

A aprendizagem supervisionada é diferente de outros paradigmas primários de aprendizagem automática:

  • Aprendizagem não supervisionada: Os algoritmos aprendem padrões a partir de dados não rotulados sem orientação explícita. As tarefas mais comuns incluem o agrupamento (agrupamento de pontos de dados semelhantes) e a redução da dimensionalidade (simplificação dos dados). É utilizada quando os dados rotulados não estão disponíveis ou o objetivo é descobrir estruturas ocultas.
  • Aprendizagem por reforço: Os algoritmos aprendem interagindo com um ambiente e recebendo feedback sob a forma de recompensas ou penalizações. O objetivo é aprender uma política (uma estratégia para escolher acções) que maximize as recompensas acumuladas ao longo do tempo. É frequentemente utilizado em robótica, jogos e sistemas de navegação.

Em suma, a aprendizagem supervisionada é uma técnica poderosa que utiliza dados rotulados para treinar modelos para tarefas de previsão, constituindo a espinha dorsal de muitas aplicações de IA bem sucedidas, incluindo as desenvolvidas e apoiadas pela Ultralytics e por plataformas como o Ultralytics HUB.

Lê tudo