Glossário

Aprendizagem Semi-Supervisionada

Desbloqueia o poder da aprendizagem semi-supervisionada para maximizar os dados rotulados e não rotulados, aumentando a eficiência em aplicações de IA. Aprende como!

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A aprendizagem semi-supervisionada é uma abordagem de aprendizagem automática que preenche a lacuna entre a aprendizagem supervisionada e a não-supervisionada, utilizando dados rotulados e não rotulados. Este método tira partido da abundância de dados não rotulados, minimizando a necessidade de instâncias rotuladas, que são muitas vezes dispendiosas e demoradas de obter.

Importância e relevância

Em cenários típicos de aprendizagem automática, a aprendizagem supervisionada baseia-se fortemente em dados rotulados, em que cada entrada é emparelhada com uma saída correta. Por outro lado, a aprendizagem não supervisionada não utiliza quaisquer rótulos. A aprendizagem semi-supervisionada atinge um equilíbrio ao utilizar uma pequena porção de dados etiquetados juntamente com um conjunto maior de dados não etiquetados. Esta abordagem é particularmente vantajosa quando a rotulagem de dados é dispendiosa ou impraticável, mas a aquisição de grandes quantidades de dados em bruto é viável.

Explora mais sobre as diferenças entre a Aprendizagem Supervisionada e a Aprendizagem Não Supervisionada para compreenderes porque é que a aprendizagem semi-supervisionada é importante.

Como funciona

Os modelos de aprendizagem semi-supervisionada são normalmente construídos através da formação inicial num conjunto de dados rotulados mais pequeno. Uma vez construído o modelo básico, os dados não rotulados são incorporados para aperfeiçoar e melhorar o modelo. São frequentemente utilizadas técnicas como a auto-formação, a co-formação e os métodos baseados em gráficos:

  • Auto-treinamento: O modelo prevê rótulos para os dados não rotulados, e essas previsões são usadas como se fossem rótulos verdadeiros na próxima rodada de treinamento.
  • Co-treinamento: Dois classificadores são treinados em diferentes perspectivas dos dados, ajudando-se mutuamente ao rotular os dados não rotulados.
  • Métodos baseados em gráficos: As instâncias de dados são representadas como nós num gráfico e os algoritmos de aprendizagem semi-supervisionada propagam a informação de etiquetas através das arestas.

Aplicações no mundo real

A aprendizagem semi-supervisionada é utilizada em vários domínios:

  • Cuidados de saúde: Na imagiologia médica, como a ressonância magnética ou a tomografia computorizada, é muitas vezes trabalhoso anotar todas as imagens. Algumas imagens são rotuladas por especialistas e o modelo aprende com imagens rotuladas e não rotuladas para reduzir a carga de anotação. Sabe mais sobre a IA em aplicações de cuidados de saúde.

  • Processamento de linguagem natural (PNL): Ao reduzir a quantidade de dados de texto etiquetados manualmente, a aprendizagem semi-supervisionada pode ajudar em tarefas como a classificação de texto e a análise de sentimentos. Descobre mais sobre as Aplicações de Processamento de Linguagem Natural.

Principais diferenças em relação a conceitos relacionados

A aprendizagem semi-supervisionada não deve ser confundida com conceitos semelhantes como a aprendizagem ativa e a aprendizagem por transferência. A Aprendizagem Ativa envolve a seleção das amostras mais informativas para rotular para uma melhor eficiência de aprendizagem. Entretanto, a aprendizagem por transferência envolve a transferência de conhecimentos de um domínio para melhorar o desempenho noutro.

Desafios e considerações

A aprendizagem semi-supervisionada enfrenta desafios como garantir a fiabilidade das etiquetas previstas e lidar com diversas distribuições de dados. Isto exige uma seleção cuidadosa das técnicas algorítmicas e, por vezes, uma validação adicional para garantir que os dados não rotulados são utilizados eficazmente sem induzir em erro o processo de aprendizagem.

Conclusão

A aprendizagem semi-supervisionada é uma ferramenta poderosa no conjunto de ferramentas de IA que aproveita a abundância de dados não rotulados para construir modelos preditivos de forma mais eficiente. Tem aplicações em muitos sectores, desde os cuidados de saúde à PNL, permitindo modelos mais robustos com menos exemplos rotulados. Compreender e explorar este conceito pode levar a soluções inovadoras onde existem estrangulamentos na rotulagem de dados. Explora como o Ultralytics HUB pode ajudar em iniciativas semelhantes de IA e aprendizagem automática, fornecendo uma plataforma versátil para a formação e implementação de modelos. Visita o Ultralytics HUB para treino e implementação de modelos.

Lê tudo