Glossário

Aprendizagem ativa

Descobre a aprendizagem ativa, um método económico de aprendizagem automática que aumenta a precisão com menos rótulos. Aprende como transforma a formação em IA!

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A Aprendizagem Ativa é um subcampo especializado da Aprendizagem Automática (AM) em que o algoritmo de aprendizagem pode consultar interactivamente um utilizador, frequentemente designado por "oráculo" ou anotador humano, para solicitar etiquetas para novos pontos de dados. Ao contrário da Aprendizagem Supervisionada tradicional, que se baseia num grande conjunto de dados pré-rotulados, a Aprendizagem Ativa visa alcançar um elevado desempenho do modelo com um esforço mínimo de rotulagem, selecionando estrategicamente as instâncias não rotuladas mais informativas para anotação. Esta abordagem é particularmente valiosa em domínios em que a obtenção de dados etiquetados é dispendiosa, demorada ou requer conhecimentos especializados.

Como funciona a aprendizagem ativa

O processo de Aprendizagem Ativa segue normalmente um ciclo iterativo:

  1. Formação inicial: Um modelo, como um Ultralytics YOLO da Ultralytics para deteção de objectos, é treinado num pequeno conjunto de dados inicialmente rotulado.
  2. Consulta: O modelo atualmente treinado analisa um conjunto de dados não rotulados e utiliza uma estratégia de consulta específica para selecionar os pontos de dados que considera mais informativos ou incertos.
  3. Anotação: Estes pontos de dados selecionados são apresentados a um anotador humano (o oráculo) para rotulagem. As práticas eficazes de recolha e anotação de dados são cruciais aqui.
  4. Treina novamente: As instâncias recém-rotuladas são adicionadas ao conjunto de treino.
  5. Iteração: O modelo é treinado novamente com o conjunto de dados rotulado expandido, e o ciclo (passos 2-5) repete-se até que um critério de paragem seja cumprido, tal como atingir um nível de precisão desejado, esgotar o orçamento de rotulagem ou observar retornos decrescentes na melhoria do desempenho.

Estratégias de consulta

O núcleo da Aprendizagem Ativa reside na sua estratégia de consulta - o método utilizado para selecionar quais os pontos de dados não rotulados a consultar a seguir. As estratégias comuns incluem:

  • Amostragem de incerteza: Seleciona as instâncias em que o modelo está menos confiante na sua previsão. Esta é talvez a estratégia mais comum. Mais detalhes podem ser encontrados em pesquisas acadêmicas como esta de Burr Settles.
  • Consulta por comité (QBC): Treina vários modelos (um comité) e seleciona as instâncias em que os membros do comité discordam mais da previsão.
  • Mudança esperada do modelo: Seleciona as instâncias que causariam a maior mudança nos parâmetros do modelo se seus rótulos fossem conhecidos.

Relevância e benefícios

A Aprendizagem Ativa reduz significativamente o peso da etiquetagem de dados, que é frequentemente um grande obstáculo no desenvolvimento de modelos de ML. Ao concentrar os esforços de anotação nos pontos de dados com maior impacto, permite às equipas

  • Obtém um desempenho de modelo comparável ou mesmo melhor com um número significativamente menor de etiquetas.
  • Reduzir os custos associados à anotação de especialistas.
  • Acelera o ciclo de vida do desenvolvimento do modelo.
  • Constrói modelos mais robustos, concentrando-se em exemplos desafiantes ou ambíguos.

Aplicações no mundo real

A aprendizagem ativa encontra aplicações em vários domínios:

  1. Análise de imagens médicas: Em tarefas como a deteção de tumores em imagens médicas, um sistema de Aprendizagem Ativa pode apresentar aos radiologistas as radiografias ou os exames de ressonância magnética mais ambíguos, maximizando o valor do seu tempo de especialista e acelerando o desenvolvimento da IA de diagnóstico. Isto é crucial para melhorar as soluções de IA para os cuidados de saúde.
  2. Processamento de linguagem natural (NLP): Para tarefas como a análise de sentimentos ou o reconhecimento de entidades nomeadas, a Aprendizagem Ativa pode selecionar trechos de texto incertos (por exemplo, publicações nas redes sociais, críticas de clientes) para revisão humana, melhorando rapidamente o desempenho do modelo com menos rotulagem manual em comparação com dados de amostragem aleatória.

Aprendizagem Ativa vs. Conceitos Relacionados

  • Aprendizagem supervisionada: Depende inteiramente de um conjunto de dados pré-existente e totalmente rotulado. Não seleciona interactivamente os dados para etiquetagem durante o treino.
  • Aprendizagem semi-supervisionada: Também usa dados rotulados e não rotulados, mas normalmente aproveita os dados não rotulados automaticamente com base em suposições sobre a estrutura dos dados (por exemplo, agrupamento, suposições múltiplas), em vez de consultar ativamente rótulos específicos. Consulta a entrada do glossário sobre Aprendizagem Semi-Supervisionada para mais informações.
  • Aprendizagem por reforço: Aprende através de interações de tentativa e erro com um ambiente, recebendo recompensas ou penalizações. Concentra-se na aprendizagem de acções óptimas e não na rotulagem eficiente de dados, como a Aprendizagem Ativa. Explora mais a Aprendizagem por Reforço no nosso glossário.

Ferramentas e implementação

A implementação da aprendizagem ativa envolve frequentemente a integração de modelos de aprendizagem ativa com ferramentas de anotação e a gestão do fluxo de trabalho de dados. Plataformas como DagsHub oferecem ferramentas para a construção de condutas de aprendizagem ativa, tal como discutido na sua palestraYOLO VISION 2023. O software de anotação, como o Label Studio, pode ser integrado nestas condutas. Gerir eficazmente conjuntos de dados e modelos treinados é crucial, e plataformas como o Ultralytics HUB fornecem infra-estruturas para organizar conjuntos de dados e modelos ao longo do ciclo de desenvolvimento.

Lê tudo