Aprende como a aprendizagem ativa é utilizada na visão por computador para minimizar os esforços de anotação e explora as suas aplicações no mundo real em várias indústrias.
Treinar um modelo de visão computacional é muito parecido com ensinar uma criança a reconhecer cores. Primeiro, precisarias de uma coleção de objectos coloridos. Depois, orientas a criança para identificar corretamente cada cor, uma tarefa que, muitas vezes, é demorada e repetitiva.
Tal como uma criança precisa de muitos exemplos para aprender, um modelo de visão precisa de um grande conjunto de dados etiquetados para reconhecer padrões e objectos em imagens. No entanto, a rotulagem de grandes quantidades de dados exige muito tempo e esforço, para não falar dos recursos. Técnicas como a aprendizagem ativa podem ajudar a simplificar este processo.
A aprendizagem ativa é um processo passo a passo em que os dados mais importantes de um grande conjunto de dados são selecionados e etiquetados. O modelo aprende com estes dados rotulados, tornando-o mais preciso e eficaz. Concentrar-se apenas nos dados mais valiosos reduz a quantidade de rotulagem necessária e acelera o desenvolvimento do modelo.
Neste artigo, veremos como a aprendizagem ativa ajuda no treino do modelo, reduz os custos de rotulagem e melhora a precisão geral do modelo.
Os conjuntos de dados são a base da visão computacional e dos modelos de aprendizagem profunda. Conjuntos de dados populares como o ImageNet oferecem milhões de imagens com diversas categorias de objectos. No entanto, a criação e a manutenção de volumes tão grandes de conjuntos de dados de alta qualidade implicam vários desafios.
Por exemplo, a recolha e a rotulagem de dados requerem tempo, recursos e anotadores qualificados, o que torna o processo difícil, dependendo da aplicação específica. São necessárias soluções inovadoras e mais eficientes para acompanhar a crescente procura de conjuntos de dados de imagens, e é exatamente isso que a aprendizagem ativa pretende resolver.
A aprendizagem ativa oferece uma solução perfeita ao otimizar o processo de rotulagem de dados. Ao selecionar estrategicamente os pontos de dados mais informativos para anotação, a aprendizagem ativa maximiza o desempenho do modelo, minimizando os esforços de rotulagem.
A aprendizagem ativa é uma técnica iterativa de aprendizagem automática em que o modelo seleciona os pontos de dados mais importantes para rotular a partir de um grande conjunto de dados não rotulados. Estes pontos de dados selecionados são etiquetados manualmente e adicionados ao conjunto de dados de treino.
O modelo é então treinado novamente no conjunto de dados atualizado e seleciona o próximo conjunto de pontos de dados a rotular. Este processo repete-se, com o modelo a melhorar continuamente, concentrando-se nos pontos de dados mais informativos. O ciclo continua até que o modelo atinja a precisão desejada ou cumpra os critérios de rotulagem previamente definidos.
Deves estar a pensar como é que a técnica de aprendizagem ativa decide quais os pontos de dados que necessitam de rotulagem manual e quais os que devem ser rotulados a seguir. Vamos compreender como funciona a aprendizagem ativa comparando-a com o estudo para um teste - concentras-te em tópicos sobre os quais não tens a certeza e também te certificas de que cobres uma variedade de assuntos para estares bem preparado.
Para o conjunto inicial de processos de seleção de dados, a aprendizagem ativa utiliza estratégias como a amostragem da incerteza e a amostragem baseada na diversidade. A amostragem da incerteza dá prioridade aos pontos de dados em que o modelo está menos confiante nas suas previsões, com o objetivo de melhorar a precisão em casos difíceis. A amostragem baseada na diversidade seleciona pontos de dados que abrangem uma vasta gama de caraterísticas, garantindo que o modelo generaliza bem para dados não vistos, expondo-o a diversos exemplos.
Após a seleção inicial dos dados, a aprendizagem ativa utiliza duas abordagens principais para a etiquetagem: a amostragem baseada em grupos e a amostragem baseada em fluxos, que são semelhantes à forma como um professor ajuda um aluno a concentrar-se no que é mais importante.
Na amostragem baseada em conjunto, o modelo examina um grande conjunto de dados não rotulados e seleciona os exemplos mais desafiantes ou informativos para rotular, tal como um estudante que dá prioridade aos cartões que considera mais difíceis. No que diz respeito à amostragem baseada em fluxo, o modelo processa os dados à medida que chegam, decidindo se os rotula ou ignora, tal como um aluno que pede ajuda apenas quando está bloqueado. Em ambos os casos, os dados rotulados são adicionados ao conjunto de treinamento, e o modelo se treina novamente, melhorando constantemente a cada iteração.
A aprendizagem ativa desempenha um papel fundamental nas aplicações de visão computacional, como a imagiologia médica e a condução autónoma, melhorando a precisão dos modelos e simplificando o processo de rotulagem dos dados. Um exemplo interessante disto são os modelos de visão computacional utilizados em carros autónomos para detetar peões ou objectos em condições de pouca luz ou nevoeiro. A aprendizagem ativa pode aumentar a precisão, concentrando-se em cenários de condução diversos e desafiantes.
Especificamente, a aprendizagem ativa pode ser utilizada para identificar dados ou fotogramas incertos de tais cenários para rotulagem selectiva. A adição destes exemplos rotulados ao conjunto de treino faz com que o modelo reconheça melhor os peões e os objectos em ambientes difíceis, como em condições meteorológicas adversas ou durante a condução nocturna.
Por exemplo, a NVIDIA utilizou a aprendizagem ativa para melhorar a deteção de peões à noite nos seus modelos de condução autónoma. Ao selecionar estrategicamente os dados mais informativos para treino, especialmente em cenários difíceis, o desempenho do modelo aumenta substancialmente.
Outro aspeto fundamental da aprendizagem ativa é o seu potencial para reduzir os custos de rotulagem. Consegue-o concentrando-se apenas nos pontos de dados mais importantes, em vez de exigir anotações para todo o conjunto de dados. Esta abordagem direcionada poupa tempo, esforço e dinheiro. Ao concentrar-se em amostras incertas ou diversas, a aprendizagem ativa reduz o número de anotações necessárias, mantendo uma elevada precisão do modelo.
De facto, a investigação mostra que a aprendizagem ativa pode reduzir os custos de etiquetagem em 40-60% sem sacrificar o desempenho. Isto é especialmente útil em sectores como os cuidados de saúde e a indústria transformadora, onde a etiquetagem de dados é dispendiosa. Ao simplificar o processo de anotação, a aprendizagem ativa ajuda as empresas a desenvolver modelos mais rapidamente e a implementá-los de forma mais eficiente, mantendo a precisão.
Eis algumas das outras vantagens fundamentais que a aprendizagem ativa pode oferecer:
A aprendizagem automática de máquinas (AutoML) centra-se na automatização das tarefas morosas e iterativas envolvidas na criação e implementação de modelos de aprendizagem automática. Simplifica os fluxos de trabalho de aprendizagem automática, automatizando tarefas como a seleção de modelos e a avaliação do desempenho para reduzir a necessidade de esforço manual.
Quando integrado com a aprendizagem ativa, o AutoML pode acelerar e otimizar o ciclo de vida do desenvolvimento do modelo. O componente de aprendizado ativo seleciona estrategicamente os pontos de dados mais informativos para rotulagem, enquanto o AutoML refina o modelo automatizando a escolha da arquitetura, dos parâmetros e do ajuste.
Vamos compreender esta combinação de tecnologias com um exemplo.
Digamos que estás a tentar detetar condições raras em imagiologia médica (um caso de utilização em que os conjuntos de dados rotulados são limitados e caros de obter). A aprendizagem ativa pode identificar e selecionar dados incertos, como alterações subtis em imagens de raios X, que o modelo não consegue classificar. Em seguida, os dados incertos podem ser priorizados para anotação manual para melhorar a compreensão do modelo.
Com os dados anotados, o AutoML pode otimizar o modelo explorando várias arquitecturas, hiperparâmetros e outras técnicas de aumento de dados. O processo iterativo acelera o desenvolvimento de modelos de visão fiáveis como Ultralytics YOLO11 que ajudam os profissionais de saúde a efetuar diagnósticos precisos.
A aprendizagem ativa e as suas técnicas oferecem inúmeras vantagens, mas há algumas considerações a ter em conta ao implementar estas estratégias:
Com os recentes avanços na IA e na visão por computador, a aprendizagem ativa está preparada para enfrentar desafios mais complexos e simplificar os fluxos de trabalho da aprendizagem automática. A combinação da aprendizagem ativa com técnicas como a aprendizagem federada e a aprendizagem auto-supervisionada pode aumentar ainda mais a eficiência e a escalabilidade dos modelos de visão.
A aprendizagem federada permite que um modelo seja treinado em vários dispositivos ou servidores com uma estrutura distribuída sem exigir que os dados saiam da sua localização original. Considera indústrias como a dos cuidados de saúde, onde a privacidade dos dados é importante, a aprendizagem federada torna possível treinar diretamente em dados locais sensíveis, mantendo-os seguros. Em vez de partilhar os dados em bruto, apenas são partilhadas as actualizações do modelo ou os conhecimentos, garantindo que as informações privadas permanecem protegidas, ao mesmo tempo que contribuem para o processo de formação.
Entretanto, a aprendizagem auto-supervisionada ajuda a reduzir a necessidade de dados rotulados através do pré-treino de modelos em dados não rotulados. Este processo cria uma base sólida para o modelo. A aprendizagem ativa pode então basear-se nesta base, identificando e selecionando os pontos de dados mais importantes para anotação humana, refinando ainda mais o modelo.
A aprendizagem ativa constitui uma forma prática de enfrentar os principais desafios da visão computacional, como o elevado custo da anotação de dados e a necessidade de modelos mais precisos. Ao centrar-se na rotulagem apenas dos pontos de dados mais valiosos, reduz o esforço exigido aos humanos, ao mesmo tempo que aumenta o desempenho do modelo.
Quando combinada com tecnologias como o AutoML, a aprendizagem ativa simplifica o desenvolvimento de modelos, automatizando tarefas que consomem muito tempo. À medida que os avanços continuam, a aprendizagem ativa está destinada a tornar-se uma ferramenta essencial para a construção de sistemas de visão por computador mais inteligentes e mais eficientes.
Explora o nosso repositório GitHub e junta-te à nossa comunidade para saberes mais sobre IA e modelos de visão computacional. Descobre mais aplicações da visão computacional no fabrico e nos cuidados de saúde nas nossas páginas de soluções. Também podes consultar as nossas opções de licenciamento para começares hoje a tua viagem pela IA de visão.
Começa a tua viagem com o futuro da aprendizagem automática