Glossário

Aprendizagem com poucos tiros

Descobre como a aprendizagem de poucos disparos permite que a IA se adapte com o mínimo de dados, transformando áreas como o diagnóstico médico e a conservação da vida selvagem.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A Aprendizagem de Poucas Oportunidades (FSL) é um subcampo da Aprendizagem Automática (ML) centrado na conceção de modelos que podem generalizar a partir de um número muito pequeno de exemplos de treino por classe, muitas vezes apenas um punhado. Isto contrasta fortemente com as abordagens tradicionais de Aprendizagem Profunda (DL) que normalmente requerem grandes quantidades de dados de treino rotulados. A ideia central é inspirada na aprendizagem humana, onde muitas vezes podemos reconhecer novos conceitos depois de ver apenas uma ou duas instâncias. A FSL é particularmente crucial em domínios em que a recolha de dados é dispendiosa, demorada ou inerentemente limitada, tornando a Inteligência Artificial (IA) mais adaptável e eficiente em termos de dados.

Como funciona a aprendizagem de poucos disparos

As técnicas de aprendizagem de poucas oportunidades visam aproveitar o conhecimento prévio para aprender rapidamente novos conceitos a partir de dados limitados. As estratégias mais comuns incluem:

  • Meta-aprendizagem: Muitas vezes descrita como "aprender a aprender", a meta-aprendizagem envolve o treino de um modelo numa variedade de tarefas de aprendizagem durante uma fase de meta-treino. Isto permite ao modelo aprender um algoritmo de aprendizagem eficiente ou parâmetros iniciais que se podem adaptar rapidamente a uma nova tarefa com poucos exemplos. Foram desenvolvidos vários algoritmos de meta-aprendizagem para este efeito.
  • Aprendizagem por transferência: A FSL utiliza frequentemente a Aprendizagem por Transferência, começando com um modelo pré-treinado num grande conjunto de dados (como o ImageNet ou o COCO). Este modelo pré-treinado, que já entende as caraterísticas gerais do grande conjunto de dados, é então ajustado usando o pequeno número de exemplos disponíveis para a tarefa alvo específica. Esta abordagem aproveita o conhecimento geral incorporado nos pesos do modelo.
  • Aumento dos dados: Gerar variações das poucas amostras de treino disponíveis utilizando técnicas de aumento de dados pode ajudar a expandir o conjunto de dados limitado, embora a sua eficácia possa variar em regimes de dados extremamente baixos. Poderão ser necessárias estratégias avançadas de aumento de dados.

Estes métodos permitem que as redes neuronais (NN) atinjam um desempenho razoável mesmo com o mínimo de dados específicos da tarefa.

Aprendizagem de poucos disparos vs. conceitos relacionados

É importante distinguir o FSL de paradigmas de aprendizagem semelhantes:

  • Aprendizagem Zero-Shot (ZSL): A ZSL tem como objetivo classificar instâncias de classes que nunca foram vistas durante o treino. Isto é normalmente conseguido através da utilização de informação auxiliar, como descrições textuais ou atributos das classes não vistas, para colmatar a lacuna entre os dados vistos e não vistos. A FSL, por outro lado, requer pelo menos alguns exemplos rotulados para cada nova classe. Uma visão geral da ZSL, FSL e Aprendizagem por Transferência pode fornecer mais contexto.
  • Aprendizagem de uma só vez (OSL): A OSL é uma variante extrema da FSL em que o modelo deve aprender a reconhecer uma nova classe a partir de apenas um exemplo rotulado. Partilha os mesmos objectivos que a FSL, mas opera sob restrições de dados ainda mais rigorosas.
  • Aprendizagem por transferência: Embora o FSL empregue frequentemente a aprendizagem por transferência como uma técnica, os termos não são intercambiáveis. A aprendizagem por transferência é um conceito mais amplo que envolve o aproveitamento do conhecimento de uma tarefa de origem para melhorar o desempenho numa tarefa de destino. A FSL aborda especificamente o desafio de aprender eficazmente quando a tarefa alvo tem dados rotulados extremamente limitados.

Aplicações da aprendizagem de poucos disparos

A FSL permite aplicações de IA em cenários em que grandes conjuntos de dados são impraticáveis ou impossíveis de obter:

  • Diagnóstico de doenças raras: Na análise de imagens médicas, é difícil obter numerosos exemplos de doenças raras para treinar modelos de diagnóstico. O FSL permite que os modelos aprendam a identificar essas condições (por exemplo, tipos específicos de tumores em exames) a partir de um pequeno conjunto de imagens de pacientes, acelerando potencialmente o diagnóstico e a investigação. Esta é uma área fundamental para a IA nos cuidados de saúde, com investigação publicada em revistas como a Radiology: Artificial Intelligence.
  • Deteção de objectos personalizada: Considera a necessidade de um modelo de Deteção de Objectos para identificar um produto recentemente concebido numa linha de fabrico ou uma espécie rara numa filmagem de conservação da vida selvagem. Adquirir milhares de imagens rotuladas pode ser inviável. A FSL permite o treinamento de modelos personalizados, como a adaptação de um modelo de Ultralytics YOLO usando plataformas como o Ultralytics HUB, com apenas um punhado de exemplos por nova classe de objeto. Isso acelera a implantação de tarefas especializadas de Visão Computacional (CV).
  • Tradução de línguas com poucos recursos: A formação de modelos de tradução para línguas com texto digital limitado requer técnicas de FSL no âmbito do Processamento de Linguagem Natural (PNL).
  • Robótica: Permitir que os robôs(Robótica) aprendam rapidamente a reconhecer e a interagir com novos objectos em ambientes desconhecidos com base numa exposição mínima é outra aplicação, explorada na investigação apresentada em conferências como a ICRA.

Desafios e direcções futuras

Apesar da sua promessa, a FSL enfrenta desafios, incluindo a sensibilidade do modelo aos poucos exemplos específicos fornecidos e a garantia de uma generalização robusta para além desses exemplos. Ultrapassar o sobreajuste com dados tão limitados é um obstáculo significativo. A investigação em curso centra-se no desenvolvimento de algoritmos de meta-aprendizagem mais robustos, no melhor aproveitamento da aprendizagem não supervisionada ou da aprendizagem auto-supervisionada para pré-treino e na criação de quadros teóricos para compreender a generalização em regimes de poucos dados. Organizações como a Google AI e a Meta AI contribuem ativamente para o avanço das técnicas FSL, com o objetivo de tornar os sistemas de IA mais flexíveis e menos exigentes em termos de dados.

Lê tudo