Como utilizar o Ultralytics YOLO11 para a classificação de imagens

Abirami Vina

4 min ler

11 de novembro de 2024

Saiba como o novo modelo Ultralytics YOLO11 melhora a classificação de imagens, oferecendo uma melhor precisão para tarefas na agricultura, retalho e monitorização da vida selvagem.

Imaginemos que um robô está a olhar para dois gatos, um preto e um branco, e precisa de descobrir qual é qual. Para o fazer, pode utilizar a classificação de imagens, uma tarefa de visão por computador que ajuda a identificar e categorizar objectos ou cenas numa imagem. De facto, graças aos recentes avanços na inteligência artificial (IA), a classificação de imagens pode ser utilizada numa grande variedade de aplicações, desde a monitorização de animais à produção e à agricultura, com a deteção de doenças nas culturas.

Um dos mais recentes avanços na classificação de imagens é o modelo Ultralytics YOLO11. Lançado no evento híbrido anual da Ultralytics, o YOLO Vision 2024 (YV24), o YOLO11 foi concebido para lidar com uma grande variedade de tarefas de IA de visão, incluindo a classificação de imagens, com facilidade e precisão.

Neste artigo, vamos explorar os fundamentos da classificação de imagens, discutir aplicações do mundo real e mostrar-lhe como pode utilizar o YOLO11 para classificação de imagens através do pacote Ultralytics Python. Também veremos como pode experimentar as capacidades do YOLO11 no Ultralytics HUB em alguns passos simples. Vamos começar!

__wf_reserved_inherit
Fig. 1. Um exemplo de utilização do Ultralytics YOLO11 para classificar um gato persa.

O que é a classificação de imagens?

A classificação de imagens funciona através da atribuição de uma etiqueta ou rótulo a uma imagem com base em padrões aprendidos a partir de imagens previamente rotuladas. Ao analisar cuidadosamente os pixéis de uma imagem, um modelo de visão por computador pode encontrar a melhor correspondência para a imagem. Modelos fiáveis como o YOLO11 podem lidar com este processo sem problemas. A arquitetura do modelo YOLO11 torna possível processar imagens ou fotogramas de vídeo quase instantaneamente, tornando-o ideal para aplicações que necessitem de uma classificação de imagem rápida e precisa.

Para compreender verdadeiramente o âmbito da classificação de imagens, é útil distingui-la de outras tarefas como a deteção de objectos. Enquanto a classificação de imagens rotula uma imagem inteira, a deteção de objectos identifica e localiza cada objeto dentro da imagem. 

__wf_reserved_inherit
Figura 2. Comparação da classificação de imagens, deteção de objectos e segmentação de imagens.

Consideremos uma imagem de uma girafa. Na classificação de imagens, o modelo pode rotular a imagem inteira simplesmente como uma girafa com base no seu conteúdo geral. No entanto, com a deteção de objectos, o modelo não se limita a identificar a girafa; também coloca uma caixa delimitadora à volta da girafa, indicando a sua localização exacta na imagem.

Agora, imagine a girafa junto a uma árvore numa savana com outros animais. Um modelo de classificação de imagens poderia rotular toda a cena como uma savana ou apenas vida selvagem. No entanto, com a deteção de objectos, o modelo identificaria cada elemento individualmente, reconhecendo a girafa, a árvore e os outros animais, cada um com as suas próprias caixas delimitadoras.

Aplicações de classificação de imagens YOLO11

A precisão e o desempenho do modelo Ultralytics YOLO11 para classificação de imagens torna-o útil numa vasta gama de indústrias. Vamos explorar algumas das principais aplicações do YOLO11 na classificação de imagens.

Classificação de imagens YOLO11 na agricultura

A classificação de imagens pode ajudar a otimizar muitas funções na agricultura e no sector agrícola. Especificamente, utilizando modelos de classificação de imagens como o YOLO11, os agricultores podem monitorizar constantemente a saúde das suas culturas, detetar doenças graves e identificar quaisquer infestações de pragas com elevada precisão. 

Eis um exemplo de como isto funciona:

  • Captura de imagens: Dispositivos da Internet das Coisas (IoT), como câmaras e drones, podem ser implantados para capturar imagens em tempo real das culturas de vários ângulos e locais nos campos.
  • Processamento: Dependendo dos recursos disponíveis e da conetividade, as imagens podem ser processadas no local através de computação periférica ou carregadas para a nuvem para uma análise mais intensiva.
  • Classificação de imagens com YOLO11: O modelo YOLO11 pode analisar essas imagens para classificar várias condições de cultivo. As classes comuns podem incluir saudável, doente, infestado de pragas ou deficiente em nutrientes, ajudando a identificar problemas específicos que afectam diferentes áreas do campo.
  • Geração de insights: Com base nas classificações, o YOLO11 fornece informações sobre indicadores de saúde das culturas, ajudando os agricultores a detetar sinais precoces de doenças, identificar pontos críticos de pragas ou detetar deficiências de nutrientes.
  • Tomada de decisões informada: Com estas informações, os agricultores podem tomar decisões específicas sobre irrigação, fertilização e controlo de pragas, aplicando recursos apenas onde são mais necessários.
__wf_reserved_inherit
Fig. 3. Um exemplo de diferentes classes de folhas, desde saudáveis a infectadas.

Classificação de imagens YOLO11 no comércio retalhista

A classificação de imagens pode melhorar significativamente a experiência de compra no retalho, tornando-a mais personalizada e fácil de utilizar. Os retalhistas podem utilizar modelos de visão por computador treinados à medida para reconhecer produtos no seu inventário e integrar esta capacidade nas suas aplicações móveis ou websites. Os clientes podem então procurar produtos simplesmente carregando uma foto, tornando as compras mais rápidas e convenientes.

Quando um cliente carrega uma imagem para um sistema de pesquisa visual, várias coisas acontecem nos bastidores antes de aparecerem os resultados da pesquisa. 

Em primeiro lugar, a deteção de objectos pode ser utilizada para escolher os itens principais da imagem, como identificar uma peça de roupa ou uma peça de mobiliário e separá-la do fundo. Em seguida, a classificação da imagem pode ser utilizada para categorizar ainda mais cada item, reconhecendo se é um casaco, uma camisa, um sofá ou uma mesa. 

Com esta informação, o sistema pode obter produtos semelhantes disponíveis para compra, o que é especialmente útil para encontrar artigos únicos ou da moda que são difíceis de descrever apenas com palavras. A mesma tecnologia também pode ajudar a simplificar outras tarefas de retalho, como a gestão de inventário, reconhecendo e categorizando automaticamente os artigos.

__wf_reserved_inherit
Fig. 4. Uma plataforma de pesquisa visual baseada na classificação de imagens em ação.

Monitorização da vida selvagem com classificação de imagens YOLO11

Tradicionalmente, a monitorização de animais na natureza é uma tarefa fastidiosa que envolve muitas pessoas que selecionam e analisam manualmente milhares de fotografias. Com modos de visão por computador como o YOLO11, os investigadores podem monitorizar automaticamente os animais a um ritmo mais rápido. As câmaras podem ser colocadas em habitats naturais para tirar fotografias. O modelo de IA de visão pode então ser utilizado para analisar essas fotografias e classificar os animais nelas contidos (se existirem). Este sistema pode ajudar os investigadores a estudar e a seguir as populações de animais, os seus padrões de migração, etc.

Outra forma de os modelos de IA e de visão por computador como o YOLO11 poderem ajudar neste domínio é simplificando o processo de classificação das espécies ameaçadas. Ao identificar potenciais espécies ou categorias de raças a que um animal pode pertencer, estes modelos podem fornecer dados essenciais aos investigadores. Por exemplo, a Universidade da Tasmânia (UTAS) desenvolveu um sistema baseado na classificação de imagens para monitorizar diferentes animais selvagens da Tasmânia. As previsões dos modelos podem ajudar os cientistas e investigadores a manterem-se atentos à atividade e ao comportamento dos animais, o que pode indicar ameaças como a caça furtiva ou a perda de habitat

__wf_reserved_inherit
Fig. 5. YOLO11 prevê as possíveis raças a que um cão pode pertencer.

Experimentar a classificação de imagens com o modelo YOLO11

Agora que já falámos sobre o que é a classificação de imagens e explorámos algumas das suas aplicações. Vamos ver como pode experimentar a classificação de imagens com o novo modelo YOLO11. Existem duas formas fáceis de começar: utilizando o pacote Ultralytics Python ou através do Ultralytics HUB. Iremos analisar as duas opções.

Execução de inferências com YOLO11

Para começar a usar o pacote Ultralytics Python, basta instalá-lo usando pip, conda ou Docker. Se você tiver algum problema, confira nosso Guia de problemas comuns para obter dicas úteis de solução de problemas.

Assim que o pacote estiver instalado, pode utilizar o seguinte código para carregar uma variante do modelo de classificação de imagens YOLO11 e executar uma inferência numa imagem. Executar uma inferência significa usar um modelo treinado para fazer previsões em dados novos e não vistos. Pode experimentar com uma imagem à sua escolha!

__wf_reserved_inherit
Fig. 6. Execução de inferências utilizando o modelo YOLO11.

Treinar um modelo de classificação YOLO11 personalizado

Também pode utilizar o mesmo pacote Python para treinar um modelo de classificação YOLO11 personalizado. O treino personalizado permite-lhe afinar um modelo YOLO11 para as suas necessidades específicas. Por exemplo, se estiver a desenvolver uma aplicação para classificar diferentes raças de gatos, pode treinar um modelo YOLO11 personalizado apenas para esse fim.

O código abaixo mostra como carregar e treinar um modelo de classificação de imagens YOLO11. Permite-lhe transferir pesos pré-treinados, utilizando o conhecimento de um modelo existente para aumentar o desempenho do seu próprio modelo. Pode especificar um conjunto de dados, como o conjunto de dados "fashion-mnist", que é um conjunto bem conhecido de imagens em escala de cinzentos de artigos de vestuário (camisas, calças, sapatos, etc.). O treino do modelo neste conjunto de dados ensina-o a reconhecer diferentes categorias de vestuário. Pode trocar "fashion-mnist" por qualquer conjunto de dados que se adeqúe ao seu projeto, como raças de gatos ou tipos de plantas.

__wf_reserved_inherit
Fig. 7. Treino personalizado de um modelo YOLO11 para classificação de imagens.

Experimente o YOLO11 no Ultralytics HUB

Embora a utilização do pacote Ultralytics seja simples, requer alguns conhecimentos de Python. Se estiver à procura de uma opção mais amigável para principiantes, pode utilizar o Ultralytics HUB, uma plataforma concebida para tornar a formação e a implementação de diferentes modelos YOLO simples e acessíveis. Para começar, é necessário criar uma conta.

Depois de iniciar sessão, navegue até à secção "Modelos" e selecione o modelo YOLO11 para classificação de imagens. Verá uma gama de tamanhos de modelos disponíveis: nano, pequeno, médio, grande e extra-grande. Depois de escolher um modelo, pode carregar uma imagem na secção 'Pré-visualização', onde as previsões aparecerão no lado esquerdo da página assim que a imagem for processada.

__wf_reserved_inherit
Fig. 8. Utilização do Ultralytics HUB para efetuar uma inferência.

Principais conclusões

O YOLO11 oferece poderosas capacidades de classificação de imagens que abrem novas possibilidades em vários sectores. Desde a melhoria da monitorização das colheitas na agricultura e a melhoria das pesquisas de produtos no retalho até ao apoio à conservação da vida selvagem, a velocidade e a precisão do YOLO11 tornam-no ideal para diversas aplicações. Com opções de formação personalizada através do pacote Ultralytics Python ou uma configuração fácil e sem código no Ultralytics HUB, os utilizadores podem facilmente incorporar o YOLO11 nos seus fluxos de trabalho. À medida que mais indústrias adoptam soluções de IA, o YOLO11 oferece uma ferramenta flexível e de elevado desempenho que apoia a inovação e os avanços práticos.

Para explorar mais, visite o nosso repositório GitHub e participe na nossa comunidade. Explore as aplicações de IA em carros autónomos e cuidados de saúde nas nossas páginas de soluções. 🚀

Vamos construir juntos o futuro
da IA!

Comece a sua viagem com o futuro da aprendizagem automática

Comece gratuitamente
Ligação copiada para a área de transferência