Descobre como a aprendizagem auto-supervisionada aproveita os dados não rotulados para uma formação eficiente, transformando a IA em visão computacional, PNL e muito mais.
A aprendizagem auto-supervisionada é uma abordagem de aprendizagem automática que utiliza dados não rotulados para treinar modelos. Ao contrário da aprendizagem supervisionada, que requer conjuntos de dados etiquetados, a aprendizagem auto-supervisionada cria as suas próprias etiquetas a partir da estrutura inerente dos próprios dados não etiquetados. Este método é particularmente valioso em domínios como a visão por computador (CV) e o processamento de linguagem natural (PNL), em que estão prontamente disponíveis grandes quantidades de dados não etiquetados, mas a etiquetagem manual é dispendiosa e morosa.
A ideia central da aprendizagem auto-supervisionada consiste em conceber uma "tarefa de pretexto" que permita a um modelo aprender representações úteis a partir de dados não rotulados. Esta tarefa de pretexto é formulada de tal forma que a sua resolução exige a compreensão de padrões significativos nos dados. Por exemplo, no processamento de imagens, uma tarefa de pretexto pode ser a previsão da rotação aplicada a um fragmento de imagem ou a coloração de uma imagem em tons de cinzento. No processamento de linguagem, uma tarefa de pretexto comum é a modelação de linguagem mascarada, em que o modelo prevê palavras mascaradas numa frase.
Quando o modelo é treinado na tarefa de pretexto utilizando uma grande quantidade de dados não rotulados, aprende caraterísticas gerais e representações dos dados. Estas representações aprendidas podem então ser transferidas e aperfeiçoadas para tarefas posteriores, como a deteção de objectos, a classificação de imagens ou a segmentação de imagens, muitas vezes com muito menos dados rotulados do que seria necessário para uma formação puramente supervisionada. Esta capacidade de aprendizagem por transferência é uma das principais vantagens da aprendizagem auto-supervisionada.
A aprendizagem auto-supervisionada tem encontrado aplicações em vários domínios, especialmente quando os dados rotulados são escassos ou dispendiosos de obter:
É importante distinguir a aprendizagem auto-supervisionada de outros paradigmas relacionados com a aprendizagem automática:
A aprendizagem auto-supervisionada representa um avanço significativo na aprendizagem automática, permitindo a utilização eficaz das vastas quantidades de dados não rotulados disponíveis e reduzindo a dependência de conjuntos de dados rotulados dispendiosos. À medida que modelos como Ultralytics YOLO11 continuam a evoluir, as técnicas auto-supervisionadas desempenharão provavelmente um papel cada vez mais importante na melhoria do seu desempenho e aplicabilidade em diversas aplicações de IA de visão.