Aprende a utilizar Albumentations para aumentos durante a formação personalizada Ultralytics YOLO11 para melhorar o desempenho do modelo com diversos dados de formação.
Ao criar uma solução de visão por computador, a recolha de um conjunto diversificado de imagens para treinar modelos de IA de visão pode ser uma parte crucial do processo. Muitas vezes, requer muito tempo e dinheiro e, por vezes, as imagens recolhidas ainda não são suficientemente variadas para que os modelos aprendam eficazmente.
Por exemplo, modelos de visão por computador como o Ultralytics YOLO11 podem ser treinados de forma personalizada em conjuntos de dados de imagens para várias tarefas de visão computacional relacionadas com diferentes aplicações. A diversidade de dados é fundamental porque ajuda o modelo a generalizar melhor, permitindo-lhe reconhecer objectos e padrões numa vasta gama de cenários do mundo real.
Se tiveres dificuldades com a falta de dados diversificados, as técnicas de aumento de dados de imagem podem ser uma óptima solução. Métodos como rodar, inverter e ajustar o brilho podem ajudar a aumentar a variedade do teu conjunto de dados, melhorando a capacidade do modelo para lidar com uma gama mais ampla de condições.
É por isso que Ultralytics suporta uma integração para aumentar os dados de imagem. Utilizando o Albumentations, uma ferramenta popular que oferece uma coleção de transformações, pode criar diversos dados visuais. Esta integração simplifica o processo de treino YOLO11 , aumentando automaticamente as imagens de treino, o que leva a um melhor desempenho do modelo.
Neste artigo, vamos explorar como podes utilizar a integração do Albumentations, as suas vantagens e o seu impacto na formação de modelos.
Os modelos de visão por computador podem aprender com um vasto conjunto de imagens de alta qualidade a reconhecer objectos em diferentes ambientes. A recolha de grandes conjuntos de dados de fontes do mundo real pode ser lenta, dispendiosa e ineficaz. Para simplificar esta tarefa, podes utilizar a ampliação de dados de imagem para criar novas variações de imagens existentes, ajudando os modelos a aprender com diferentes cenários sem recolher mais dados.
Especificamente, podes tirar partido da Albumentations, uma biblioteca de código aberto introduzida em 2018 para um aumento eficiente dos dados de imagem. Suporta uma variedade de operações, desde alterações geométricas simples, como rotações e inversões, até ajustes mais complexos, como brilho, contraste e adição de ruído.
O Albumentations é conhecido pelo seu elevado desempenho, o que significa que pode processar imagens de forma rápida e eficiente. Construído em bibliotecas optimizadas como OpenCV e NumPy, lida com grandes conjuntos de dados com um tempo de processamento mínimo, tornando-o ideal para o aumento rápido de dados durante o treino do modelo.
Apresentamos-te outras caraterísticas importantes das Albumentações:
Podes estar a pensar: há muitas formas de aplicar aumentos a um conjunto de dados, e podes até criar os teus próprios aumentos utilizando ferramentas como o OpenCV. Então, porquê escolher uma integração que suporte uma biblioteca como a Albumentations?
A criação manual de aumentos com ferramentas como o OpenCV pode demorar muito tempo e requer alguma experiência. Também pode ser complicado afinar as transformações para obter os melhores resultados. A integração do Albumentations facilita este processo. Oferece muitas transformações prontas a usar que podem poupar tempo e esforço ao preparar o conjunto de dados.
Outra razão para escolher a integração Albumentations é o facto de funcionar sem problemas com o pipeline deformação de modelos Ultralytics . Torna muito mais fácil o treino personalizado YOLO11, uma vez que os aumentos são aplicados automaticamente durante o treino. Simplifica o processo, para que te possas concentrar mais em melhorar o teu modelo do que em lidar com a preparação dos dados.
Curiosamente, utilizar as integrações do Albumentations para treinar YOLO11 é mais simples do que parece. Assim que as bibliotecas corretas estiverem configuradas, a integração aplica automaticamente aumentos de dados de imagem durante o treino. Ajuda o modelo a aprender com diferentes variações de imagem usando o mesmo conjunto de dados.
De seguida, vamos explicar-te como instalar e utilizar a integração do Albumentations na formação personalizada YOLO11.
Antes de aplicares as ampliações, é necessário instalar o pacoteUltralytics Python e o Albumentations. A integração foi criada de modo a que ambas as bibliotecas trabalhem em conjunto sem problemas por defeito, pelo que não precisas de te preocupar com configurações complexas.
Todo o processo de instalação pode ser concluído em apenas alguns minutos com um único comando pip, que é uma ferramenta de gestão de pacotes para instalar bibliotecas Python , como mostra a imagem abaixo.
Quando o Albumentations estiver instalado, o modo de treino do modelo Ultralytics aplica automaticamente aumentos de imagem durante o treino. Se o Albumentations não estiver instalado, estas ampliações não serão aplicadas. Para mais informações, consulta a documentação oficial Ultralytics .
Vamos perceber melhor o que se passa nos bastidores da integração do Albumentations.
Vê aqui mais de perto os aumentos que estão a ser aplicados durante o treino YOLO11 :
Se estiveres a treinar YOLO11 para uma aplicação específica, a integração do Albumentations pode ajudar a melhorar o desempenho do modelo, adaptando-se a várias condições. Vamos discutir algumas aplicações do mundo real e os desafios que esta integração pode resolver.
A IA de visão nos cuidados de saúde está a ajudar os médicos a analisar as imagens médicas com maior precisão para ajudar nos diagnósticos e melhorar os cuidados aos doentes. De facto, cerca de um quinto das organizações de cuidados de saúde já estão a utilizar soluções de IA.
No entanto, a criação dessas soluções de visão computacional vem com seu próprio conjunto de desafios. Os exames médicos podem variar muito entre hospitais, influenciados por factores como diferentes equipamentos, configurações e até mesmo a experiência dos técnicos. As variações de brilho, contraste e exposição podem afetar a consistência e a precisão dos modelos de Vision AI, tornando difícil o seu desempenho fiável em diferentes ambientes.
É aqui que a integração de ferramentas como o Albumentations se torna essencial. Ao gerar várias versões aumentadas do mesmo exame, o Albumentations permite que o modelo aprenda com uma variedade de qualidades de imagem. Isto ajuda o modelo a tornar-se mais robusto, permitindo-lhe detetar doenças com precisão tanto em imagens de alta como de baixa qualidade.
Outra aplicação interessante da IA de visão é a segurança e a vigilância. A deteção de objectos em tempo real pode ajudar as equipas de segurança a identificar rapidamente potenciais ameaças.
Uma das principais preocupações relacionadas com esta aplicação é que as câmaras de segurança captam imagens sob várias condições de iluminação ao longo do dia, e estas condições podem afetar drasticamente a forma como um modelo compreende essas imagens. Factores como ambientes com pouca luz, brilho ou fraca visibilidade podem dificultar a deteção de objectos ou o reconhecimento de potenciais ameaças de forma consistente pelos modelos de visão por computador.
A integração do Albumentations ajuda-te a aplicar transformações para imitar diferentes condições de iluminação. Isto permite que o modelo aprenda a detetar objectos tanto em ambientes com muita como pouca luz, tornando-o mais fiável e melhorando os tempos de resposta em condições difíceis.
Um derrame num corredor de supermercado, um cão a correr pela loja ou uma criança a derrubar um expositor de produtos são apenas alguns exemplos de eventos quotidianos que podem ser casos extremos para a IA de visão em ambientes de retalho . A visão computacional é cada vez mais utilizada para melhorar a experiência do cliente, acompanhando o comportamento do comprador, monitorizando o tráfego pedonal e identificando produtos nas prateleiras. No entanto, estas situações do mundo real podem ser difíceis para os sistemas de IA compreenderem e processarem com precisão.
Embora nem todos os cenários possam ser representados num conjunto de dados de visão por computador, a integração do Albumentations ajuda a aumentar os dados para cobrir muitas situações possíveis, como iluminação inesperada, ângulos invulgares ou obstruções. Isso ajuda os modelos de visão computacional a se adaptarem a várias condições, melhorando sua capacidade de lidar com casos extremos e fazer previsões precisas em ambientes dinâmicos de varejo.
A recolha de diversos dados do mundo real para o treino de modelos pode ser complicada, mas o Albumentations facilita-o ao criar variações de imagem que ajudam os modelos a adaptarem-se a diferentes condições.
A integração do Albumentations suportada pelo Ultralytics simplifica o processo de aplicação destas ampliações durante o treino personalizado YOLO11. Isto resulta numa melhor qualidade do conjunto de dados, o que beneficia uma vasta gama de indústrias ao produzir modelos de IA de visão mais precisos e fiáveis.
Junta-te à nossa comunidade e explora o nosso repositório GitHub para saberes mais sobre IA e verifica as nossas opções de licenciamento para iniciares os teus projectos de IA de Visão. Estás interessado em inovações como a IA no fabrico ou a visão computacional na condução autónoma? Visita as nossas páginas de soluções para saberes mais.
Começa a tua viagem com o futuro da aprendizagem automática