Glossário

Aprendizagem Semi-Supervisionada

Descubra como a Aprendizagem Semi-Supervisionada combina dados etiquetados e não etiquetados para melhorar os modelos de IA, reduzir os custos de etiquetagem e aumentar a precisão.

A aprendizagem semi-supervisionada (SSL) é uma técnica de aprendizagem automática (ML) que faz a ponte entre a aprendizagem supervisionada e a aprendizagem não supervisionada. Aproveita uma pequena quantidade de dados etiquetados juntamente com uma grande quantidade de dados não etiquetados para melhorar a precisão da aprendizagem. Em muitos cenários do mundo real, a aquisição de dados não etiquetados é barata, mas o processo de etiquetagem dos dados é dispendioso e demorado. A SSL aborda este desafio, permitindo que os modelos aprendam a partir do vasto conjunto de exemplos não rotulados, guiados pela estrutura e informações fornecidas pelo conjunto rotulado mais pequeno. Esta abordagem é particularmente poderosa na aprendizagem profunda (DL), em que os modelos requerem enormes conjuntos de dados para alcançar um elevado desempenho.

Como funciona a Aprendizagem Semi-Supervisionada

A ideia central por detrás do SSL é utilizar os dados rotulados para construir um modelo inicial e, em seguida, utilizar este modelo para fazer previsões sobre os dados não rotulados. As previsões mais confiantes do modelo são então tratadas como "pseudo-rótulos" e adicionadas ao conjunto de treino. O modelo é então treinado novamente com base nesta combinação de rótulos originais e pseudo-rótulos de elevada confiança. Este processo iterativo permite que o modelo aprenda a estrutura subjacente de todo o conjunto de dados, e não apenas a pequena parte rotulada.

As técnicas comuns de SSL incluem:

  • Regularização de consistência: Este método reforça a ideia de que as previsões do modelo devem permanecer consistentes mesmo quando os dados de entrada são ligeiramente perturbados. Por exemplo, uma imagem com um pequeno aumento de dados deve produzir a mesma classificação.
  • Modelos generativos: Técnicas como as Redes Adversárias Generativas (GAN) podem aprender a gerar dados que se assemelham à verdadeira distribuição de dados, ajudando a definir melhor os limites de decisão entre classes.
  • Métodos baseados em grafos: Estes métodos representam os pontos de dados como nós num grafo e propagam etiquetas dos nós etiquetados para os não etiquetados com base na sua proximidade ou semelhança. Uma panorâmica técnica pode ser encontrada em estudos académicos.

Aplicações no mundo real

O SSL é altamente eficaz em domínios onde a rotulagem é um estrangulamento. Dois exemplos proeminentes incluem:

  1. Análise de imagens médicas: A rotulagem de exames médicos como ressonâncias magnéticas ou tomografias computadorizadas para a deteção de tumores requer radiologistas especializados e é muito cara. Com o SSL, um modelo pode ser treinado em algumas centenas de exames rotulados e depois refinado usando milhares de exames não rotulados de arquivos hospitalares. Isto permite o desenvolvimento de modelos robustos de classificação e segmentação de imagens com muito menos esforço manual.
  2. Conteúdo da Web e classificação de documentos: A classificação manual de milhares de milhões de páginas Web, artigos de notícias ou críticas de clientes é impraticável. O SSL pode utilizar um pequeno conjunto de documentos categorizados manualmente para treinar um classificador de texto inicial. O modelo classifica então o corpus maciço de documentos não rotulados, utilizando as suas próprias previsões para melhorar ao longo do tempo para tarefas como a análise de sentimentos ou a categorização de tópicos.

Comparação com outros paradigmas de aprendizagem

É importante distinguir a SSL dos conceitos relacionados com a Inteligência Artificial (IA):

  • Aprendizagem auto-supervisionada (SSL): Embora partilhe o mesmo acrónimo, a aprendizagem auto-supervisionada é diferente. É um tipo de aprendizagem não supervisionada em que as etiquetas são geradas a partir dos próprios dados através de tarefas pré-textuais (por exemplo, prever uma palavra mascarada numa frase). Não utiliza quaisquer dados etiquetados manualmente, enquanto a aprendizagem semi-supervisionada requer um pequeno conjunto de dados explicitamente etiquetados para orientar o processo de formação do modelo.
  • Aprendizagem ativa: Esta técnica também tem como objetivo reduzir os custos de rotulagem. No entanto, em vez de utilizar todos os dados não etiquetados, um modelo de aprendizagem ativa consulta de forma inteligente um anotador humano para etiquetar os pontos de dados mais informativos. A SSL, pelo contrário, utiliza normalmente os dados não rotulados sem interação humana direta durante a formação.
  • Aprendizagem por transferência: Isto envolve a utilização de um modelo pré-treinado num grande conjunto de dados (como o ImageNet) e, em seguida, o seu aperfeiçoamento num conjunto de dados mais pequeno e específico da tarefa. Embora ambos aproveitem o conhecimento existente, a SSL aprende com os dados não rotulados da própria tarefa-alvo, enquanto a aprendizagem por transferência aproveita o conhecimento de uma tarefa diferente (embora muitas vezes relacionada).

Ferramentas e formação

Muitas estruturas modernas de aprendizagem profunda (DL), incluindo o PyTorch(sítio oficial do PyTorch) e o TensorFlow(sítio oficial do TensorFlow), oferecem funcionalidades ou podem ser adaptadas para implementar algoritmos SSL. Bibliotecas como a Scikit-learn fornecem alguns métodos SSL. Plataformas como o Ultralytics HUB simplificam o processo, facilitando a gestão de conjuntos de dados que podem conter misturas de dados etiquetados e não etiquetados, simplificando a formação e a implementação de modelos concebidos para tirar partido dessas estruturas de dados. A investigação em SSL continua a evoluir, com contribuições frequentemente apresentadas nas principais conferências de IA, como a NeurIPS e a ICML.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Ligue-se, colabore e cresça com inovadores globais

Aderir agora
Ligação copiada para a área de transferência