A Aprendizagem One-Shot (OSL) é uma área especializada da aprendizagem automática (ML) em que o objetivo é classificar novos exemplos com base apenas numa única instância de treino para cada classe. Isto contrasta fortemente com os métodos tradicionais de aprendizagem supervisionada, que muitas vezes requerem milhares de exemplos rotulados por classe para alcançar uma elevada precisão. A OSL é particularmente relevante em cenários em que os dados de treino são escassos, dispendiosos ou demorados a recolher, tornando-a uma técnica crucial para aplicações do mundo real em que as limitações de dados são comuns.
Como funciona a aprendizagem de uma só vez
Em vez de aprender a mapear diretamente uma entrada para uma etiqueta de classe a partir de numerosos exemplos, os modelos OSL aprendem normalmente uma função de semelhança. A ideia central é determinar a semelhança entre um exemplo novo e inédito (consulta) e o único exemplo rotulado disponível (suporte) para cada classe. Se o exemplo de consulta for muito semelhante ao exemplo de suporte de uma classe específica, é-lhe atribuído o rótulo dessa classe. Isto envolve frequentemente a utilização de arquitecturas de aprendizagem profunda (DL) como as redes siamesas, que processam duas entradas simultaneamente para determinar a sua semelhança. Estas redes são frequentemente pré-treinadas em grandes conjuntos de dados (como o ImageNet) utilizando a aprendizagem por transferência para aprender representações de caraterísticas robustas antes de serem adaptadas à tarefa OSL através de técnicas como a aprendizagem métrica.
Conceitos-chave no One-Shot Learning
- Conjunto de suporte: Contém o único exemplo rotulado fornecido para cada classe com a qual o modelo precisa de aprender.
- Conjunto de consulta: Contém os exemplos não rotulados que o modelo precisa de classificar com base no conjunto de apoio.
- Aprendizagem de similaridade/métrica: O processo de aprendizagem de uma função de distância ou métrica que mede a semelhança entre pontos de dados, crucial para comparar exemplos de consulta com exemplos de suporte.
- Treinamento episódico: Uma estratégia de treinamento comum em que o modelo é treinado em muitas tarefas OSL pequenas (episódios) amostradas de um conjunto de dados maior para simular o cenário de um disparo durante o treinamento.
Aprendizagem única vs. paradigmas relacionados
Para compreender a OSL, é necessário distingui-la de conceitos relacionados:
- Aprendizagem com poucos tiros (FSL): A OSL é considerada uma variante extrema da FSL. Enquanto a OSL utiliza apenas um exemplo por classe, a FSL utiliza um pequeno número (k > 1, normalmente 5 ou 10) de exemplos por classe. Ambos abordam a escassez de dados, mas diferem no número de amostras disponíveis. Podes ler mais sobre estes paradigmas na nossa publicação no blogue sobre a compreensão da aprendizagem de transferência, de poucas amostras e de zero amostras.
- Aprendizagem Zero-Shot (ZSL): A ZSL aborda um problema ainda mais difícil: classificar instâncias de classes que nunca foram vistas durante o treino. Isto é normalmente conseguido através da utilização de informações auxiliares, como atributos semânticos ou descrições de texto, que ligam classes vistas e não vistas. A OSL requer a visualização de um exemplo; a ZSL requer a visualização de zero exemplos, mas necessita de contexto semântico adicional.
- Aprendizagem por transferência e ajuste fino: Embora a OSL utilize frequentemente a aprendizagem por transferência (pré-treino num grande conjunto de dados), o objetivo é diferente. A aprendizagem por transferência padrão ou o ajuste fino geralmente assumem que uma quantidade razoável de dados de destino está disponível para adaptação, enquanto a OSL lida especificamente com a restrição de um exemplo. Técnicas como o treino personalizado dos modelos Ultralytics YOLO envolvem frequentemente o ajuste fino de pesos pré-treinados, mas normalmente com mais de um exemplo por classe.
Aplicações no mundo real
A OSL permite várias aplicações anteriormente impedidas por limitações de dados:
- Reconhecimento facial: Os sistemas de segurança ou os dispositivos pessoais podem ter de identificar ou verificar uma pessoa depois de a registar com uma única fotografia. O NIST efectua testes exaustivos às tecnologias de reconhecimento facial, muitas das quais enfrentam desafios semelhantes de uma ou poucas fotografias.
- Deteção de objectos raros: Em áreas como o controlo de qualidade do fabrico ou a conservação da vida selvagem, a identificação de defeitos raros ou de espécies em vias de extinção só pode ser possível com um ou muito poucos exemplos anteriores. Enquanto modelos como o Ultralytics YOLO11 são excelentes na deteção de objectos com dados suficientes, as técnicas de OSL poderiam aumentá-los para classes extremamente raras.
- Verificação de assinatura: Autenticar a assinatura de uma pessoa com base numa única assinatura de referência armazenada num ficheiro. A investigação explora a aprendizagem profunda para esta tarefa, muitas vezes em regimes de poucos dados.
- Descoberta de medicamentos: Identifica potenciais novos candidatos a medicamentos ou prevê as propriedades das moléculas com base em resultados experimentais muito limitados, acelerando o processo de investigação. Estudos mostram a aplicação da OSL na previsão das interações fármaco-alvo.
Desafios e direcções futuras
O principal desafio em OSL é a generalização: como é que um modelo pode aprender de forma fiável a essência de uma classe a partir de apenas um exemplo sem se ajustar demasiado? A escolha e a qualidade do exemplo de apoio único tornam-se extremamente importantes. A investigação em curso centra-se no desenvolvimento de representações de caraterísticas mais robustas, de melhores métricas de semelhança e na utilização de técnicas como a meta-aprendizagem ("aprender a aprender") para melhorar o desempenho da OSL. A integração das capacidades de OSL em modelos e plataformas de visão de uso geral, como o Ultralytics HUB, poderia alargar significativamente a sua aplicabilidade em ambientes com restrições de dados. A avaliação dos modelos de OSL requer uma análise cuidadosa das métricas de desempenho nestas condições difíceis.