Glossário

Aprendizagem Zero-Shot

Descobre a Aprendizagem Zero-Shot: uma abordagem de IA de ponta que permite que os modelos classifiquem dados não vistos, revolucionando a deteção de objectos, a PNL e muito mais.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A Aprendizagem Zero-Shot (ZSL) representa uma área fascinante da Aprendizagem Automática (AM) em que um modelo é treinado para reconhecer e classificar categorias de dados que nunca viu explicitamente durante a fase de treino. Ao contrário das abordagens tradicionais de aprendizagem supervisionada que requerem exemplos rotulados para cada categoria possível, a ZSL visa generalizar o conhecimento de classes vistas para classes não vistas utilizando informação auxiliar partilhada. Esta capacidade é particularmente valiosa em cenários do mundo real onde a aquisição de dados rotulados para cada categoria concebível é impraticável ou impossível.

Como funciona a aprendizagem Zero-Shot

A ideia central da ZSL é aprender um mapeamento entre o espaço de caraterísticas de entrada (por exemplo, caraterísticas de imagem ou caraterísticas de texto) e um espaço de incorporação semântica. Este espaço semântico codifica tipicamente propriedades descritivas de alto nível ou atributos que são partilhados entre classes vistas e não vistas. Por exemplo, na visão por computador, estes podem ser atributos visuais como "tem riscas", "tem pelo", "tem asas" ou descrições baseadas em texto. No Processamento de Linguagem Natural (PLN), as palavras incorporadas servem frequentemente como este espaço semântico.

Durante o treino, o modelo aprende a associar as caraterísticas das classes vistas às suas representações semânticas correspondentes (por exemplo, atributos ou embeddings). No momento da inferência, quando lhe é apresentada uma instância de uma classe não vista, o modelo extrai as suas caraterísticas e mapeia-as no espaço semântico aprendido. Ao comparar este mapeamento com as representações semânticas conhecidas de classes não vistas (fornecidas separadamente), o modelo pode prever o rótulo da classe mesmo sem exemplos anteriores. Os modelos de aprendizagem profunda, particularmente os que utilizam técnicas como a aprendizagem contrastiva, como o CLIP, são frequentemente utilizados para tarefas de ZSL devido à sua capacidade de aprender representações de caraterísticas ricas. Podes explorar vários conjuntos de dados adequados para essas tarefas, como os listados na documentaçãoUltralytics Datasets.

Aplicações no mundo real

A Aprendizagem Zero-Shot permite aplicações poderosas em vários domínios:

  1. Reconhecimento de novos objectos: Na classificação de imagens ou deteção de objectos, a ZSL permite que os sistemas identifiquem objectos que não estão presentes nos dados de treino iniciais. Por exemplo, um sistema de monitorização da vida selvagem treinado em animais comuns poderia potencialmente identificar uma espécie rara ou recém-descoberta com base numa descrição textual ou num conjunto de atributos semânticos fornecidos por especialistas. Modelos como o Ultralytics YOLO tiram partido desta capacidade para a deteção de vocabulário aberto.
  2. Categorização dinâmica de conteúdo: A ZSL pode classificar documentos, artigos noticiosos ou conteúdos gerados pelo utilizador em tópicos emergentes para os quais não existam dados previamente rotulados. Um sistema pode ser treinado com base em categorias existentes e, em seguida, utilizar palavras incorporadas ou descrições de tópicos para classificar conteúdos relacionados com eventos ou tendências imprevistas.

ZSL vs. paradigmas de aprendizagem relacionados

É importante distinguir a ZSL de conceitos relacionados:

  • Aprendizagem com poucos exemplos: Procura aprender novas classes a partir de um número muito pequeno de exemplos rotulados (mais do que zero).
  • Aprendizagem de uma só vez: Um caso específico de aprendizagem de poucas tentativas em que apenas um exemplo rotulado está disponível para cada nova classe.
  • Aprendizagem por transferência: Envolve o aproveitamento do conhecimento adquirido numa tarefa ou domínio para melhorar o desempenho numa tarefa ou domínio diferente, mas relacionado. Frequentemente, envolve o ajuste fino de um modelo pré-treinado em dados alvo, que normalmente incluem exemplos das classes alvo.

A principal diferença é que a ZSL funciona sob a condição estrita de ter zero exemplos rotulados para as classes alvo durante o treino ou a adaptação. Para uma visão geral comparativa, ver a discussão sobre Compreender a Aprendizagem de Transferência, de Pouca Captura e de Zero Captura.

Importância na IA

A aprendizagem Zero-Shot melhora significativamente a escalabilidade e a adaptabilidade dos sistemas de IA. Reduz a dependência da recolha e anotação exaustiva de dados, que é frequentemente um obstáculo no desenvolvimento de aplicações de ML em grande escala. Ao permitir que os modelos raciocinem sobre conceitos invisíveis, a ZSL ultrapassa os limites da generalização na Inteligência Artificial (IA), tornando os sistemas mais robustos e capazes de lidar com a natureza aberta do mundo real. Plataformas como o Ultralytics HUB facilitam o treinamento e a implantação de modelos, incluindo aqueles que potencialmente alavancarão os princípios da ZSL no futuro. Para mais detalhes sobre a investigação ZSL, consulta recursos como a página ZSL da Wikipedia ou pesquisas académicas encontradas em plataformas como o arXiv.

Lê tudo