Glossário

Aprendizado Ativo

Descubra como a aprendizagem ativa otimiza o treinamento de IA. Aprenda a usar Ultralytics para identificar dados informativos, reduzir custos de rotulagem e aumentar a precisão.

A aprendizagem ativa é uma abordagem estratégica em aprendizagem automática (ML) em que o algoritmo seleciona proativamente os pontos de dados mais informativos para rotulagem, em vez de aceitar passivamente um conjunto de dados pré-rotulado. Na aprendizagem supervisionada tradicional, os modelos geralmente requerem grandes quantidades de dados anotados, cuja criação pode ser cara e demorada. A aprendizagem ativa otimiza esse processo identificando exemplos "incertos" ou "difíceis" — aqueles próximos ao limite de decisão ou onde o modelo carece de confiança — e solicitando que anotadores humanos rotulem apenas essas instâncias específicas . Esse ciclo iterativo permite que os modelos alcancem alta precisão com um número significativamente menor de amostras rotuladas, tornando-o altamente eficiente para projetos com orçamentos limitados ou restrições de tempo.

Como funciona o ciclo de aprendizagem ativa

O núcleo da aprendizagem ativa é um ciclo de feedback frequentemente referido como human-in-the-loop. Em vez de treinar uma vez num conjunto de dados estático, o modelo evolui através de ciclos de consulta e atualização.

Inicialização: O processo começa com um pequeno conjunto de dados de treino rotulados usados para treinar um modelo inicial, como o Ultralytics .
Seleção de consulta: O modelo avalia um grande conjunto de dados não rotulados. Usando uma estratégia de consulta— mais comumente amostragem de incerteza — ele seleciona as imagens ou o texto onde as suas previsões são menos confiáveis.
Anotação: Essas amostras de alta prioridade são enviadas a um especialista humano, frequentemente chamado de "oráculo" na literatura sobre aprendizagem ativa, para rotulagem de dados.
Reaprendizagem: Os dados recém-rotulados são adicionados ao conjunto de treino e o modelo é reaprendido. Este modelo atualizado fica então mais bem equipado para selecionar o próximo lote de amostras confusas.

Aplicações no Mundo Real

A aprendizagem ativa é indispensável em setores onde os dados são abundantes, mas a rotulagem requer conhecimento especializado ou custos elevados.

Análise de imagens médicas: Em áreas como a radiologia, a rotulagem requer especialistas certificados, cujo tempo é extremamente valioso. Em vez de pedir a um médico para anotar milhares de exames claros, um sistema de aprendizagem ativa pode filtrar casos ambíguos — como tumores em estágio inicial ou anomalias raras — permitindo que o especialista se concentre apenas nas imagens que realmente melhoram a capacidade de diagnóstico do modelo.
Veículos autónomos: Os carros autônomos geram petabytes de dados de vídeo. Rotular cada quadro é impossível. O aprendizado ativo ajuda os engenheiros a identificar casos extremos, como pedestres usando fantasias ou dirigindo em neve pesada, que os modelos padrão de detecção de objetos podem não detectar. Ao priorizar esses cenários raros, as empresas melhoram a segurança sem desperdiçar recursos em imagens repetitivas de rodovias.

Python : Filtrando previsões incertas

O exemplo a seguir demonstra uma lógica simples de «amostragem de incerteza» usando o Ultralytics . Carregamos um modelo, executamos a inferência nas imagens e sinalizamos aquelas cuja pontuação de confiança está abaixo de um determinado limite para revisão manual.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# List of unlabeled image paths
unlabeled_images = ["https://ultralytics.com/images/bus.jpg", "https://ultralytics.com/images/zidane.jpg"]

# Run inference
results = model(unlabeled_images)

# Identify samples with low confidence for active learning
uncertain_threshold = 0.6
for result in results:
    # Check if any detection confidence is below the threshold
    if result.boxes.conf.numel() > 0 and result.boxes.conf.min() < uncertain_threshold:
        print(f"Active Learning Query: {result.path} needs human labeling.")

Distinguir conceitos relacionados

É importante diferenciar a aprendizagem ativa de paradigmas de formação semelhantes:

Aprendizagem semi-supervisionada: Embora ambos os métodos utilizem dados não rotulados, a aprendizagem semi-supervisionada atribui automaticamente pseudo-rótulos aos dados com base nas previsões de alta confiança do modelo . Em contrapartida, a aprendizagem ativa solicita explicitamente a intervenção humana nas previsões de baixa confiança.
Aprendizagem por transferência: Isso envolve pegar um modelo pré-treinado (como um treinado no ImageNet) e adaptá-lo a uma nova tarefa. A aprendizagem ativa concentra-se em quais dados rotular, enquanto a aprendizagem por transferência concentra-se na reutilização de características aprendidas.
Aprendizagem por reforço: Aqui, um agente aprende ao interagir com um ambiente e receber recompensas. A aprendizagem ativa é diferente porque busca rótulos estáticos de verdade fundamental de um oráculo, em vez de otimizar uma sequência de ações para obter uma recompensa.

Integração com MLOps

A implementação eficaz da aprendizagem ativa requer um robusto pipeline de operações de aprendizagem automática (MLOps) . É necessária uma infraestrutura para gerir o controlo de versões de dados, acionar tarefas de retreinamento e fornecer a interface de anotação para humanos. Ferramentas que se integram ao Ultralytics permitem que os utilizadores alternem facilmente entre inferência, curadoria de dados e treinamento. Por exemplo, o uso de scripts de treinamento personalizados permite que os desenvolvedores incorporem rapidamente novos lotes de dados de aprendizagem ativa aos seus YOLO .

Para mais informações sobre estratégias de amostragem, os investigadores costumam consultar pesquisas abrangentes na literatura sobre aprendizagem ativa. Além disso, compreender as métricas de avaliação do modelo é crucial para verificar se o ciclo de aprendizagem ativa está realmente a melhorar o desempenho.

Aprendizado Ativo

Treine os modelosYOLO Ultralytics para simplificar os fluxos de trabalho em todos os sectores

Solução de licenciamento empresarial flexível para impulsionar sua inovação

Treine modelos de IA em segundos com o Ultralytics YOLO

Como funciona o ciclo de aprendizagem ativa

Aplicações no Mundo Real

Python : Filtrando previsões incertas

Distinguir conceitos relacionados

Integração com MLOps

Leia mais nesta categoria

12 casos de uso de imagens aéreas com tecnologia de visão computacional

O que é a estimativa de profundidade monocular? Uma visão geral

Uma análise sobre o usoYOLO Ultralytics para deteção de ameaças por IA

Junte-se à comunidade Ultralytics