Glossário

Aprendizagem Semi-Supervisionada

Aprende como a aprendizagem semi-supervisionada combina dados etiquetados e não etiquetados para aumentar a precisão do modelo, poupar esforço de etiquetagem e resolver desafios do mundo real.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A aprendizagem semi-supervisionada é uma abordagem poderosa na aprendizagem automática (ML) que aproveita tanto os dados etiquetados como os não etiquetados para treinar modelos. Esta técnica é particularmente útil quando a obtenção de dados etiquetados é dispendiosa ou demorada, enquanto os dados não etiquetados são abundantes e estão facilmente disponíveis. Ao combinar os pontos fortes da aprendizagem supervisionada e não-supervisionada, a aprendizagem semi-supervisionada pode atingir uma elevada precisão com menos dependência de conjuntos de dados totalmente rotulados, o que a torna uma ferramenta valiosa em várias aplicações do mundo real.

Como funciona a Aprendizagem Semi-Supervisionada

Os algoritmos de aprendizagem semi-supervisionada utilizam uma pequena quantidade de dados etiquetados para orientar o processo de aprendizagem, extraindo simultaneamente padrões e estruturas de um conjunto maior de dados não etiquetados. Os dados rotulados fornecem supervisão explícita, ensinando ao modelo relações específicas entre entradas e saídas. Os dados não rotulados, por outro lado, ajudam o modelo a aprender a distribuição subjacente e as caraterísticas dos dados, melhorando a sua capacidade de generalização para exemplos novos e não vistos.

Existem várias abordagens à aprendizagem semi-supervisionada, incluindo:

  • Auto-treinamento: O modelo é inicialmente treinado nos dados etiquetados e depois utilizado para prever etiquetas para os dados não etiquetados. As previsões de alta confiança são adicionadas ao conjunto rotulado, e o modelo é treinado novamente de forma iterativa.
  • Co-treinamento: Dois ou mais modelos são treinados em diferentes vistas ou subconjuntos de dados rotulados. Em seguida, cada modelo rotula os dados não rotulados e as previsões são utilizadas para aumentar o conjunto de treino dos outros modelos.
  • Modelos generativos: Estes modelos, como as Redes Adversárias Generativas (GAN), aprendem a distribuição de probabilidade conjunta dos dados e das etiquetas. Podem então gerar novos pontos de dados ou inferir rótulos em falta com base na distribuição aprendida.
  • Métodos baseados em gráficos: Estes métodos representam os dados como um gráfico, em que os nós são pontos de dados (etiquetados e não etiquetados) e as arestas representam semelhanças entre eles. A informação de etiqueta propaga-se através do gráfico, permitindo ao modelo inferir etiquetas para nós não etiquetados.

Vantagens da Aprendizagem Semi-Supervisionada

A aprendizagem semi-supervisionada oferece várias vantagens importantes:

  • Reduz o esforço de etiquetagem: Ao utilizar dados não rotulados, a aprendizagem semi-supervisionada reduz significativamente a necessidade de rotulagem manual extensiva, poupando tempo e recursos.
  • Precisão melhorada: A inclusão de dados não rotulados ajuda o modelo a aprender uma representação mais abrangente da distribuição de dados, o que muitas vezes leva a uma maior precisão em comparação com a utilização apenas de dados rotulados.
  • Melhor generalização: A exposição a um conjunto de dados maior e mais diversificado, incluindo exemplos rotulados e não rotulados, melhora a capacidade do modelo de generalizar para dados não vistos.
  • Tirar partido da abundância de dados não rotulados: Em muitos domínios, os dados não rotulados estão facilmente disponíveis (por exemplo, imagens da Internet, texto de páginas Web). A aprendizagem semi-supervisionada permite-nos tirar partido deste vasto recurso.

Aplicações da Aprendizagem Semi-Supervisionada

A aprendizagem semi-supervisionada encontra aplicações em vários domínios, incluindo:

  • Visão computacional: As tarefas de deteção de objectos, classificação de imagens e segmentação de imagens podem beneficiar da aprendizagem semi-supervisionada, especialmente quando as imagens marcadas são escassas. Por exemplo, um modelo pode ser treinado para detetar objectos específicos em imagens utilizando um pequeno conjunto de imagens marcadas e uma grande coleção de imagens não marcadas da Internet. Explora como os modelos Ultralytics YOLO estão a transformar a visão por computador com soluções inovadoras.
  • Processamento de linguagem natural: A análise de sentimentos, a classificação de texto e o reconhecimento de entidades nomeadas podem tirar partido da aprendizagem semi-supervisionada para melhorar o desempenho quando os dados de texto marcados são limitados. Por exemplo, um modelo pode ser treinado para classificar o sentimento das avaliações de produtos usando um pequeno conjunto de avaliações rotuladas e um grande corpus de avaliações não rotuladas de fóruns on-line. Descobre mais sobre o processamento de linguagem natural (PNL).
  • Diagnóstico médico: Nos cuidados de saúde, a obtenção de dados médicos etiquetados pode ser um desafio devido a preocupações com a privacidade e à necessidade de anotações de peritos. A aprendizagem semi-supervisionada pode ser usada para treinar modelos para diagnóstico de doenças, análise de imagens médicas e descoberta de medicamentos usando uma combinação de dados de pacientes rotulados e não rotulados. Sabe mais sobre a IA nos cuidados de saúde.
  • Deteção de fraudes: A aprendizagem semi-supervisionada pode melhorar os sistemas de deteção de fraudes, aprendendo com um pequeno conjunto de transacções fraudulentas rotuladas e um grande volume de dados de transacções não rotuladas. O modelo pode identificar padrões e anomalias indicativos de fraude, mesmo com exemplos rotulados limitados.

Comparação com outros paradigmas de aprendizagem

A aprendizagem semi-supervisionada difere da aprendizagem supervisionada e da aprendizagem não-supervisionada nos seguintes aspectos:

  • Aprendizagem supervisionada: Depende apenas de dados rotulados para treino. Embora preciso, pode ser limitado pela disponibilidade e custo dos dados rotulados.
  • Aprendizagem não supervisionada: Usa apenas dados não rotulados para descobrir padrões e estruturas. Embora seja útil para a análise exploratória, não aprende diretamente a mapear entradas para saídas específicas.
  • Aprendizagem Semi-Supervisionada: Encontra um equilíbrio entre a aprendizagem supervisionada e não supervisionada, aproveitando os dados rotulados e não rotulados para obter um melhor desempenho com menos esforço de rotulagem.

A aprendizagem semi-supervisionada também pode ser vista como uma forma de aprendizagem ativa, em que o modelo seleciona ativamente os pontos de dados não rotulados mais informativos para serem rotulados por um oráculo (por exemplo, um perito humano). No entanto, na aprendizagem semi-supervisionada, o modelo baseia-se principalmente nos dados rotulados existentes e na estrutura dos dados não rotulados, em vez de procurar ativamente novos rótulos.

Para mais informações sobre conceitos relacionados com a aprendizagem automática, explora o glossárioUltralytics .

Lê tudo