A aprendizagem semi-supervisionada é uma abordagem poderosa na aprendizagem automática (ML) que aproveita tanto os dados etiquetados como os não etiquetados para treinar modelos. Esta técnica é particularmente útil quando a obtenção de dados etiquetados é dispendiosa ou demorada, enquanto os dados não etiquetados são abundantes e estão facilmente disponíveis. Ao combinar os pontos fortes da aprendizagem supervisionada e não-supervisionada, a aprendizagem semi-supervisionada pode atingir uma elevada precisão com menos dependência de conjuntos de dados totalmente rotulados, o que a torna uma ferramenta valiosa em várias aplicações do mundo real.
Como funciona a Aprendizagem Semi-Supervisionada
Os algoritmos de aprendizagem semi-supervisionada utilizam uma pequena quantidade de dados etiquetados para orientar o processo de aprendizagem, extraindo simultaneamente padrões e estruturas de um conjunto maior de dados não etiquetados. Os dados rotulados fornecem supervisão explícita, ensinando ao modelo relações específicas entre entradas e saídas. Os dados não rotulados, por outro lado, ajudam o modelo a aprender a distribuição subjacente e as caraterísticas dos dados, melhorando a sua capacidade de generalização para exemplos novos e não vistos.
Existem várias abordagens à aprendizagem semi-supervisionada, incluindo:
- Auto-treinamento: O modelo é inicialmente treinado nos dados etiquetados e depois utilizado para prever etiquetas para os dados não etiquetados. As previsões de alta confiança são adicionadas ao conjunto rotulado, e o modelo é treinado novamente de forma iterativa.
- Co-treinamento: Dois ou mais modelos são treinados em diferentes vistas ou subconjuntos de dados rotulados. Em seguida, cada modelo rotula os dados não rotulados e as previsões são utilizadas para aumentar o conjunto de treino dos outros modelos.
- Modelos generativos: Estes modelos, como as Redes Adversárias Generativas (GAN), aprendem a distribuição de probabilidade conjunta dos dados e das etiquetas. Podem então gerar novos pontos de dados ou inferir rótulos em falta com base na distribuição aprendida.
- Métodos baseados em gráficos: Estes métodos representam os dados como um gráfico, em que os nós são pontos de dados (etiquetados e não etiquetados) e as arestas representam semelhanças entre eles. A informação de etiqueta propaga-se através do gráfico, permitindo ao modelo inferir etiquetas para nós não etiquetados.
Vantagens da Aprendizagem Semi-Supervisionada
A aprendizagem semi-supervisionada oferece várias vantagens importantes:
- Reduz o esforço de etiquetagem: Ao utilizar dados não rotulados, a aprendizagem semi-supervisionada reduz significativamente a necessidade de rotulagem manual extensiva, poupando tempo e recursos.
- Precisão melhorada: A inclusão de dados não rotulados ajuda o modelo a aprender uma representação mais abrangente da distribuição de dados, o que muitas vezes leva a uma maior precisão em comparação com a utilização apenas de dados rotulados.
- Melhor generalização: A exposição a um conjunto de dados maior e mais diversificado, incluindo exemplos rotulados e não rotulados, melhora a capacidade do modelo de generalizar para dados não vistos.
- Tirar partido da abundância de dados não rotulados: Em muitos domínios, os dados não rotulados estão facilmente disponíveis (por exemplo, imagens da Internet, texto de páginas Web). A aprendizagem semi-supervisionada permite-nos tirar partido deste vasto recurso.
Aplicações da Aprendizagem Semi-Supervisionada
A aprendizagem semi-supervisionada encontra aplicações em vários domínios, incluindo:
- Visão computacional: As tarefas de deteção de objectos, classificação de imagens e segmentação de imagens podem beneficiar da aprendizagem semi-supervisionada, especialmente quando as imagens marcadas são escassas. Por exemplo, um modelo pode ser treinado para detetar objectos específicos em imagens utilizando um pequeno conjunto de imagens marcadas e uma grande coleção de imagens não marcadas da Internet. Explora como os modelos Ultralytics YOLO estão a transformar a visão por computador com soluções inovadoras.
- Processamento de linguagem natural: A análise de sentimentos, a classificação de texto e o reconhecimento de entidades nomeadas podem tirar partido da aprendizagem semi-supervisionada para melhorar o desempenho quando os dados de texto marcados são limitados. Por exemplo, um modelo pode ser treinado para classificar o sentimento das avaliações de produtos usando um pequeno conjunto de avaliações rotuladas e um grande corpus de avaliações não rotuladas de fóruns on-line. Descobre mais sobre o processamento de linguagem natural (PNL).
- Diagnóstico médico: Nos cuidados de saúde, a obtenção de dados médicos etiquetados pode ser um desafio devido a preocupações com a privacidade e à necessidade de anotações de peritos. A aprendizagem semi-supervisionada pode ser usada para treinar modelos para diagnóstico de doenças, análise de imagens médicas e descoberta de medicamentos usando uma combinação de dados de pacientes rotulados e não rotulados. Sabe mais sobre a IA nos cuidados de saúde.
- Deteção de fraudes: A aprendizagem semi-supervisionada pode melhorar os sistemas de deteção de fraudes, aprendendo com um pequeno conjunto de transacções fraudulentas rotuladas e um grande volume de dados de transacções não rotuladas. O modelo pode identificar padrões e anomalias indicativos de fraude, mesmo com exemplos rotulados limitados.
Comparação com outros paradigmas de aprendizagem
A aprendizagem semi-supervisionada difere da aprendizagem supervisionada e da aprendizagem não-supervisionada nos seguintes aspectos:
- Aprendizagem supervisionada: Depende apenas de dados rotulados para treino. Embora preciso, pode ser limitado pela disponibilidade e custo dos dados rotulados.
- Aprendizagem não supervisionada: Usa apenas dados não rotulados para descobrir padrões e estruturas. Embora seja útil para a análise exploratória, não aprende diretamente a mapear entradas para saídas específicas.
- Aprendizagem Semi-Supervisionada: Encontra um equilíbrio entre a aprendizagem supervisionada e não supervisionada, aproveitando os dados rotulados e não rotulados para obter um melhor desempenho com menos esforço de rotulagem.
A aprendizagem semi-supervisionada também pode ser vista como uma forma de aprendizagem ativa, em que o modelo seleciona ativamente os pontos de dados não rotulados mais informativos para serem rotulados por um oráculo (por exemplo, um perito humano). No entanto, na aprendizagem semi-supervisionada, o modelo baseia-se principalmente nos dados rotulados existentes e na estrutura dos dados não rotulados, em vez de procurar ativamente novos rótulos.
Para mais informações sobre conceitos relacionados com a aprendizagem automática, explora o glossárioUltralytics .