Glossário

Aprendizagem ativa

Descubra a aprendizagem ativa, um método económico de aprendizagem automática que aumenta a precisão com menos rótulos. Saiba como transforma a formação em IA!

A aprendizagem ativa é uma metodologia de formação especializada em aprendizagem automática (ML) em que um algoritmo de aprendizagem pode consultar interactivamente um utilizador ou outra fonte de informação (um "oráculo") para rotular novos pontos de dados. A ideia central é que, se um modelo puder escolher os dados a partir dos quais aprende, pode atingir uma maior precisão com uma quantidade significativamente menor de dados de formação. Isto é particularmente valioso em domínios em que a rotulagem de dados é dispendiosa, demorada ou requer conhecimentos especializados. Em vez de rotular todo um conjunto de dados de uma só vez, a aprendizagem ativa dá prioridade às amostras mais "informativas" para rotulagem, tornando o processo de formação do modelo muito mais eficiente.

Como funciona a aprendizagem ativa

O processo de aprendizagem ativa é cíclico e é muitas vezes descrito como um fluxo de trabalho humano no circuito. Normalmente, segue as seguintes etapas:

  1. Treino inicial do modelo: Um modelo, como um detetor Ultralytics YOLO11, é primeiro treinado num pequeno conjunto de dados inicialmente rotulado.
  2. Consulta de dados não rotulados: O modelo parcialmente treinado é então utilizado para fazer previsões num grande conjunto de dados não rotulados. Com base nestas previsões, o modelo seleciona um subconjunto de amostras sobre o qual tem mais "incertezas".
  3. Anotação humana: Estas amostras incertas são apresentadas a um perito humano (o oráculo), que fornece as etiquetas corretas.
  4. Aumento do conjunto de dados: As amostras recém-rotuladas são adicionadas ao conjunto de treino.
  5. Retreinamento: O modelo é treinado novamente com o conjunto de dados atualizado e maior. Este ciclo repete-se até que o desempenho do modelo atinja um limiar desejado ou o orçamento de rotulagem se esgote.

A chave para este processo reside na estratégia de consulta. As estratégias comuns incluem a amostragem de incertezas (selecionando instâncias em que o modelo está menos confiante), a consulta por comité (utilizando vários modelos e selecionando instâncias em que não estão de acordo) ou a estimativa da alteração esperada do modelo. Uma boa visão geral destas estratégias pode ser encontrada neste inquérito sobre Aprendizagem Ativa.

Aplicações no mundo real

A aprendizagem ativa é altamente eficaz em domínios especializados em que a anotação por peritos é um obstáculo.

  • Análise de imagens médicas: Quando se treina uma IA para detetar doenças como o cancro a partir de exames médicos, pode haver milhões de imagens disponíveis mas apenas uma quantidade limitada do tempo de um radiologista. Em vez de os colocar a etiquetar imagens aleatórias, um sistema de aprendizagem ativa pode identificar os casos mais ambíguos ou raros para análise. Isto concentra o esforço do especialista onde é mais necessário, acelerando o desenvolvimento de um modelo altamente preciso para tarefas como a deteção de tumores cerebrais. A investigação nesta área mostra reduções significativas no esforço de rotulagem, conforme detalhado em estudos como este sobre segmentação de imagens biomédicas.
  • Condução autónoma: Os sistemas de perceção em veículos autónomos devem ser treinados em conjuntos de dados vastos e diversificados que abrangem inúmeros cenários de condução. A aprendizagem ativa pode identificar "casos extremos" a partir de dados de condução recolhidos - como um peão parcialmente escondido por um obstáculo ou condições meteorológicas invulgares - com os quais o modelo atual de deteção de objectos tem dificuldades. Ao dar prioridade a estas cenas difíceis para anotação, os programadores podem melhorar mais eficazmente a robustez e a segurança do modelo.

Aprendizagem Ativa vs. Conceitos Relacionados

É importante distinguir a Aprendizagem Ativa de outros paradigmas de aprendizagem que também utilizam dados não rotulados:

  • Aprendizagem Semi-Supervisionada: Utiliza simultaneamente dados rotulados e não rotulados durante a formação. Ao contrário da Aprendizagem Ativa, normalmente utiliza todos os dados não rotulados disponíveis de forma passiva, em vez de consultar seletivamente instâncias específicas para obter rótulos.
  • Aprendizagem auto-supervisionada: Aprende representações a partir de dados não rotulados, criando tarefas pré-textuais (por exemplo, prever uma parte mascarada de uma imagem). Não requer anotação humana durante a sua fase de pré-treino, enquanto a Aprendizagem Ativa depende de um oráculo para as etiquetas. A DeepMind explorou extensivamente esta área.
  • Aprendizagem por reforço: Aprende por tentativa e erro através de interações com um ambiente, recebendo recompensas ou penalizações por acções. Não envolve a consulta de rótulos explícitos como a Aprendizagem Ativa.
  • Aprendizagem federada: Centra-se na formação de modelos em dispositivos descentralizados, mantendo os dados a nível local, abordando principalmente as preocupações com a privacidade dos dados. A aprendizagem ativa centra-se na aquisição eficiente de etiquetas. Por vezes, estas técnicas podem ser combinadas.

Ferramentas e implementação

A implementação da aprendizagem ativa envolve frequentemente a integração de modelos de aprendizagem ativa com ferramentas de anotação e a gestão do fluxo de trabalho dos dados. Estruturas como o scikit-learn oferecem algumas funcionalidades, enquanto existem bibliotecas especializadas para tarefas específicas. O software de anotação, como o Label Studio, pode ser integrado em pipelines de aprendizagem ativa, permitindo que os anotadores forneçam etiquetas para amostras consultadas. A gestão eficaz de conjuntos de dados em evolução e de modelos treinados é crucial, e plataformas como o Ultralytics HUB fornecem infra-estruturas para organizar estes activos ao longo do ciclo de vida do desenvolvimento. Explore o repositório Ultralytics GitHub para obter mais informações sobre a implementação de técnicas avançadas de ML.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Ligue-se, colabore e cresça com inovadores globais

Aderir agora
Ligação copiada para a área de transferência