Descubra como a Aprendizagem Semi-Supervisionada combina dados etiquetados e não etiquetados para melhorar os modelos de IA, reduzir os custos de etiquetagem e aumentar a precisão.
A aprendizagem semi-supervisionada (SSL) é uma técnica de aprendizagem automática (ML) que faz a ponte entre a aprendizagem supervisionada e a aprendizagem não supervisionada. Aproveita uma pequena quantidade de dados etiquetados juntamente com uma grande quantidade de dados não etiquetados para melhorar a precisão da aprendizagem. Em muitos cenários do mundo real, a aquisição de dados não etiquetados é barata, mas o processo de etiquetagem dos dados é dispendioso e demorado. A SSL aborda este desafio, permitindo que os modelos aprendam a partir do vasto conjunto de exemplos não rotulados, guiados pela estrutura e informações fornecidas pelo conjunto rotulado mais pequeno. Esta abordagem é particularmente poderosa na aprendizagem profunda (DL), em que os modelos requerem enormes conjuntos de dados para alcançar um elevado desempenho.
A ideia central por detrás do SSL é utilizar os dados rotulados para construir um modelo inicial e, em seguida, utilizar este modelo para fazer previsões sobre os dados não rotulados. As previsões mais confiantes do modelo são então tratadas como "pseudo-rótulos" e adicionadas ao conjunto de treino. O modelo é então treinado novamente com base nesta combinação de rótulos originais e pseudo-rótulos de elevada confiança. Este processo iterativo permite que o modelo aprenda a estrutura subjacente de todo o conjunto de dados, e não apenas a pequena parte rotulada.
As técnicas comuns de SSL incluem:
O SSL é altamente eficaz em domínios onde a rotulagem é um estrangulamento. Dois exemplos proeminentes incluem:
É importante distinguir a SSL dos conceitos relacionados com a Inteligência Artificial (IA):
Muitas estruturas modernas de aprendizagem profunda (DL), incluindo o PyTorch(sítio oficial do PyTorch) e o TensorFlow(sítio oficial do TensorFlow), oferecem funcionalidades ou podem ser adaptadas para implementar algoritmos SSL. Bibliotecas como a Scikit-learn fornecem alguns métodos SSL. Plataformas como o Ultralytics HUB simplificam o processo, facilitando a gestão de conjuntos de dados que podem conter misturas de dados etiquetados e não etiquetados, simplificando a formação e a implementação de modelos concebidos para tirar partido dessas estruturas de dados. A investigação em SSL continua a evoluir, com contribuições frequentemente apresentadas nas principais conferências de IA, como a NeurIPS e a ICML.