Glossário

Aprendizagem Semi-Supervisionada

Descobre como a Aprendizagem Semi-Supervisionada combina dados etiquetados e não etiquetados para melhorar os modelos de IA, reduzir os custos de etiquetagem e aumentar a precisão.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A Aprendizagem Semi-Supervisionada (SSL) representa um poderoso meio-termo na Aprendizagem Automática (AM), combinando uma pequena quantidade de dados rotulados com uma grande quantidade de dados não rotulados durante o treino. Esta abordagem é particularmente valiosa em cenários em que a aquisição de dados rotulados é dispendiosa, demorada ou impraticável, mas os dados não rotulados são abundantes. A SSL visa aproveitar a estrutura subjacente nos dados não rotulados para melhorar o desempenho do modelo para além do que poderia ser alcançado usando apenas os dados rotulados limitados, tornando-a uma técnica prática para muitos problemas de Inteligência Artificial (IA) do mundo real.

Como funciona a Aprendizagem Semi-Supervisionada

Os algoritmos SSL funcionam com base em determinados pressupostos sobre a relação entre os dados etiquetados e não etiquetados. Os pressupostos comuns incluem o "pressuposto de suavidade" (os pontos próximos uns dos outros partilham provavelmente uma etiqueta) ou o "pressuposto de agrupamento" (os dados tendem a formar agrupamentos distintos e os pontos dentro do mesmo agrupamento partilham provavelmente uma etiqueta). As técnicas envolvem frequentemente o treino de um modelo inicial nos dados rotulados e, em seguida, a sua utilização para gerar pseudo-rótulos para os dados não rotulados com base em previsões de elevada confiança. O modelo é então treinado novamente com os dados originais rotulados e com os novos dados pseudo-rotulados. Outra abordagem é a regularização da consistência, em que o modelo é encorajado a produzir o mesmo resultado para um exemplo não rotulado, mesmo que a sua entrada seja ligeiramente perturbada, o que é frequentemente conseguido através do aumento dos dados. Estes métodos permitem que o modelo aprenda com os padrões e a distribuição inerentes ao grande conjunto de amostras não rotuladas. As técnicas mais avançadas são exploradas em recursos como as publicações no blogue de IAGoogle sobre SSL.

Comparação com outros paradigmas de aprendizagem

A Aprendizagem Semi-Supervisionada ocupa um espaço único entre outros tipos de aprendizagem primária:

  • Aprendizagem supervisionada: Baseia-se inteiramente em dados de treino rotulados. A SSL difere ao incorporar dados não rotulados para melhorar potencialmente o desempenho quando os dados rotulados são escassos.
  • Aprendizagem não supervisionada: Usa apenas dados não rotulados para encontrar padrões ou estruturas, como agrupamento ou redução de dimensionalidade. A SSL utiliza dados não rotulados, mas orienta o processo de aprendizagem com um pequeno conjunto de exemplos rotulados para realizar tarefas como a classificação ou a regressão.
  • Aprendizagem auto-supervisionada (SSL): Um tipo de aprendizagem não supervisionada em que as etiquetas são geradas automaticamente a partir dos próprios dados de entrada (por exemplo, prever uma parte mascarada de uma imagem). Embora utilize dados não rotulados, o seu mecanismo de geração de supervisão difere dos métodos semi-supervisionados típicos que combinam explicitamente dados pré-rotulados e não rotulados.

Aplicações no mundo real

O SSL é altamente eficaz em domínios em que a rotulagem é um estrangulamento:

  1. Classificação de páginas da Web: É possível classificar manualmente um pequeno número de sítios Web (por exemplo, "desporto", "notícias", "tecnologia"), mas é impraticável classificar milhares de milhões. O SSL pode usar o vasto número de sites não rotulados para melhorar a precisão e a robustez do classificador, aprendendo com o conteúdo do texto e as estruturas de links(visão geral da mineração de conteúdo da Web).
  2. Reconhecimento de voz: A transcrição de áudio exige um esforço humano significativo. A SSL permite que os sistemas treinem com uma pequena quantidade de áudio transcrito juntamente com grandes volumes de dados de áudio não transcritos, melhorando o reconhecimento de diversos sotaques e estilos de fala(investigação sobre processamento da fala).
  3. Análise de imagens médicas: A anotação especializada de exames médicos (como ressonâncias magnéticas ou tomografias para deteção de tumores) é dispendiosa e requer conhecimentos especializados. A SSL pode aproveitar numerosos exames não rotulados para melhorar o desempenho de modelos de diagnóstico treinados num conjunto limitado de imagens anotadas, conduzindo potencialmente a melhores soluções de IA nos cuidados de saúde.
  4. Deteção de objectos em Visão por Computador (CV): A criação de caixas delimitadoras precisas para objectos em milhares de imagens é trabalhosa(guia de recolha e anotação de dados). As técnicas SSL podem utilizar muitas imagens ou quadros de vídeo não rotulados juntamente com um conjunto de dados rotulados mais pequeno para melhorar o desempenho do detetor para modelos como Ultralytics YOLO.

Vantagens e desafios

A principal vantagem da SSL é a sua capacidade de reduzir a dependência de grandes conjuntos de dados rotulados, poupando tempo e recursos associados à rotulagem dos dados. Conduz frequentemente a uma melhor generalização do modelo em comparação com modelos puramente supervisionados treinados em dados limitados, explorando informações de amostras não rotuladas. No entanto, o sucesso da SSL depende em grande medida do facto de os pressupostos subjacentes aos dados estarem corretos. Se estes pressupostos não se mantiverem (por exemplo, se a distribuição dos dados não rotulados for muito diferente da dos dados rotulados), os métodos SSL podem até degradar o desempenho. A seleção e implementação cuidadosas das técnicas SSL são cruciais, exigindo frequentemente conhecimentos especializados em práticas de MLOps.

Ferramentas e formação

Muitas estruturas modernas de aprendizagem profunda (DL), incluindo PyTorchPyTorch site oficialPyTorch ) e TensorFlowTensorFlow ), oferecem funcionalidades ou podem ser adaptadas para implementar algoritmos SSL. Bibliotecas como a Scikit-learn fornecem alguns métodos SSL. Plataformas como o Ultralytics HUB simplificam o processo, facilitando a gestão de conjuntos de dadosUltralytics HUB Datasets documentation) que podem conter misturas de dados etiquetados e não etiquetados, simplificando a formaçãoUltralytics HUB Cloud Training) e a implementação(model deployment options guide) de modelos concebidos para tirar partido dessas estruturas de dados. A investigação em SSL continua a evoluir, com contribuições frequentemente apresentadas nas principais conferências de IA, como a NeurIPS e a ICML.

Lê tudo