Verificação verde
Link copiado para a área de transferência

Como utilizar o Ultralytics YOLO11 para a classificação de imagens

Aprende como o novo modelo Ultralytics YOLO11 melhora a classificação de imagens, oferecendo uma melhor precisão para tarefas na agricultura, retalho e monitorização da vida selvagem.

Digamos que um robô está a olhar para dois gatos, um preto e um branco, e precisa de descobrir qual é qual. Para o fazer, pode utilizar a classificação de imagens, uma tarefa de visão por computador que ajuda a identificar e categorizar objectos ou cenas numa imagem. De facto, graças aos recentes avanços na inteligência artificial (IA), a classificação de imagens pode ser utilizada numa grande variedade de aplicações, desde a monitorização de animais à produção e à agricultura, com a deteção de doenças nas culturas.

Um dos mais recentes avanços na classificação de imagens é o modeloUltralytics YOLO11 . Lançado no evento híbrido anual daUltralytics, YOLO Vision 2024 (YV24), YOLO11 foi concebido para lidar com uma grande variedade de tarefas de IA de visão, incluindo a classificação de imagens, com facilidade e precisão.

Neste artigo, vamos explorar os fundamentos da classificação de imagens, discutir aplicações do mundo real e mostrar-te como podes utilizar o YOLO11 para classificação de imagens através do pacoteUltralytics Python . Também veremos como podes experimentar as capacidades doYOLO11 no HUB Ultralytics em alguns passos simples. Vamos começar!

__wf_reserved_inherit
Fig. 1. Um exemplo de utilização de Ultralytics YOLO11 para classificar um gato persa.

O que é a classificação de imagens?

A classificação de imagens funciona atribuindo um rótulo ou etiqueta a uma imagem com base em padrões aprendidos a partir de imagens previamente rotuladas. Ao analisar cuidadosamente os pixéis de uma imagem, um modelo de visão por computador pode encontrar a melhor correspondência para a imagem. Modelos fiáveis como o YOLO11 podem lidar com este processo sem problemas. YOLO11A arquitetura do modelo do 's torna possível processar imagens ou fotogramas de vídeo quase instantaneamente, tornando-o ideal para aplicações que necessitem de uma classificação de imagens rápida e precisa.

Para compreender verdadeiramente o âmbito da classificação de imagens, é útil distingui-la de outras tarefas como a deteção de objectos. Enquanto a classificação de imagens rotula uma imagem inteira, a deteção de objectos identifica e localiza cada objeto dentro da imagem. 

__wf_reserved_inherit
Figura 2. Comparação da classificação de imagens, deteção de objectos e segmentação de imagens.

Consideremos uma imagem de uma girafa. Na classificação de imagens, o modelo pode rotular a imagem inteira simplesmente como uma girafa com base no seu conteúdo geral. No entanto, com a deteção de objectos, o modelo não se limita a identificar a girafa; também coloca uma caixa delimitadora à volta da girafa, indicando a sua localização exacta na imagem.

Agora, imagina a girafa junto a uma árvore numa savana com outros animais. Um modelo de classificação de imagens poderia rotular toda a cena como uma savana ou apenas vida selvagem. No entanto, com a deteção de objectos, o modelo identificaria cada elemento individualmente, reconhecendo a girafa, a árvore e os outros animais, cada um com as suas próprias caixas delimitadoras.

Aplicações de classificação de imagens YOLO11

A precisão e o desempenho do modelo Ultralytics YOLO11 para classificação de imagens torna-o útil numa vasta gama de indústrias. Vamos explorar algumas das principais aplicações do YOLO11 na classificação de imagens.

Classificação de imagens YOLO11 na agricultura

A classificação de imagens pode ajudar a otimizar muitas funções na agricultura e na indústria agrícola. Especificamente, utilizando modelos de classificação de imagens como YOLO11, os agricultores podem monitorizar constantemente a saúde das suas culturas, detetar doenças graves e identificar quaisquer infestações de pragas com elevada precisão. 

Vê aqui como isto funciona:

  • Captura de imagens: Os dispositivos da Internet das Coisas (IoT), como câmaras e drones, podem ser implantados para capturar imagens em tempo real das culturas de vários ângulos e locais nos campos.
  • Processamento: Dependendo dos recursos disponíveis e da conetividade, as imagens podem ser processadas no local através de computação periférica ou carregadas para a nuvem para uma análise mais intensiva.
  • Classificação de imagens com o YOLO11: O modelo YOLO11 pode analisar estas imagens para classificar as várias condições das culturas. As classes comuns podem incluir saudável, doente, infestado de pragas ou deficiente em nutrientes, ajudando a identificar problemas específicos que afectam diferentes áreas do campo.
  • Geração de insights: Com base nas classificações, YOLO11 fornece informações sobre os indicadores de saúde das culturas, ajudando os agricultores a detetar sinais precoces de doenças, identificar pontos críticos de pragas ou detetar deficiências de nutrientes.
  • Tomada de decisões informada: Com estas informações, os agricultores podem tomar decisões específicas sobre irrigação, fertilização e controlo de pragas, aplicando recursos apenas onde são mais necessários.
__wf_reserved_inherit
Fig. 3. Um exemplo de diferentes classes de folhas, de saudáveis a infectadas.

Classificação de imagens YOLO11 no comércio retalhista

A classificação de imagens pode melhorar significativamente a experiência de compra no retalho, tornando-a mais personalizada e fácil de utilizar. Os retalhistas podem utilizar modelos de visão computacional treinados à medida para reconhecer produtos no seu inventário e integrar esta capacidade nas suas aplicações móveis ou websites. Os clientes podem então procurar produtos simplesmente carregando uma foto, tornando as compras mais rápidas e convenientes.

Quando um cliente carrega uma imagem para um sistema de pesquisa visual, várias coisas acontecem nos bastidores antes de aparecerem os resultados da pesquisa. 

Primeiro, a deteção de objectos pode ser utilizada para escolher os itens principais na imagem, como identificar uma peça de roupa ou uma peça de mobiliário e separá-la do fundo. Em seguida, a classificação da imagem pode ser utilizada para categorizar ainda mais cada item, reconhecendo se é um casaco, uma camisa, um sofá ou uma mesa. 

Com esta informação, o sistema pode obter produtos semelhantes disponíveis para compra, o que é especialmente útil para encontrar artigos únicos ou da moda que são difíceis de descrever apenas com palavras. A mesma tecnologia também pode ajudar a simplificar outras tarefas de retalho, como a gestão de inventário, reconhecendo e categorizando automaticamente os artigos.

__wf_reserved_inherit
Figura 4. Uma plataforma de pesquisa visual baseada na classificação de imagens em ação.

Monitorização da vida selvagem com classificação de imagens YOLO11

Tradicionalmente, a monitorização de animais em estado selvagem é uma tarefa fastidiosa que envolve muitas pessoas que selecionam e analisam manualmente milhares de fotografias. Com modos de visão por computador como YOLO11, os investigadores podem monitorizar automaticamente os animais a um ritmo mais rápido. As câmaras podem ser colocadas em habitats naturais para tirar fotografias. O modelo de visão da IA pode então ser utilizado para analisar estas fotografias e classificar os animais nelas presentes (se existirem). Este sistema pode ajudar os investigadores a estudar e a seguir as populações de animais, os seus padrões de migração, etc.

Outra forma de a IA e os modelos de visão por computador, como o YOLO11 , poderem ajudar neste domínio é simplificando o processo de classificação das espécies ameaçadas de extinção. Ao identificar potenciais espécies ou categorias de raças a que um animal pode pertencer, estes modelos podem fornecer dados essenciais aos investigadores. Por exemplo, a Universidade da Tasmânia (UTAS) desenvolveu um sistema baseado na classificação de imagens para monitorizar diferentes animais selvagens da Tasmânia. As previsões dos modelos podem ajudar os cientistas e investigadores a manterem-se atentos à atividade e ao comportamento dos animais, o que pode indicar ameaças como a caça furtiva ou a perda de habitat

__wf_reserved_inherit
Fig 5. YOLO11 prevê as possíveis raças a que um cão pode pertencer.

Experimenta a classificação de imagens com o modelo YOLO11

Agora que já falámos sobre o que é a classificação de imagens e explorámos algumas das suas aplicações. Vamos ver como podes experimentar a classificação de imagens com o novo modelo YOLO11 . Há duas maneiras fáceis de começar: usando o pacoteUltralytics Python ou através do Ultralytics HUB. Vamos examinar as duas opções.

Executa inferências utilizando YOLO11

Para começar a usar o pacote Ultralytics Python , basta instalá-lo usando pip, conda ou Docker. Se tiveres algum problema, consulta o nosso Guia de Problemas Comuns para obteres dicas úteis de resolução de problemas.

Assim que o pacote estiver instalado, podes utilizar o seguinte código para carregar uma variante do modelo de classificação de imagens YOLO11 e executar uma inferência numa imagem. Executar uma inferência significa usar um modelo treinado para fazer previsões em dados novos e não vistos. Podes experimentar com uma imagem à tua escolha!

__wf_reserved_inherit
Fig. 6. Executa inferências utilizando o modelo YOLO11 .

Treinar um modelo de classificação YOLO11 personalizado

Também podes utilizar o mesmo pacote Python para treinar um modelo de classificação YOLO11 personalizado. O treino personalizado permite-te afinar um modelo YOLO11 para as tuas necessidades específicas. Por exemplo, se estiveres a desenvolver uma aplicação para classificar diferentes raças de gatos, podes treinar um modelo YOLO11 personalizado apenas para esse fim.

O código abaixo mostra como carregar e treinar um modelo de classificação de imagens YOLO11 . Permite-te transferir pesos pré-treinados, utilizando o conhecimento de um modelo existente para aumentar o desempenho do teu próprio modelo. Podes especificar um conjunto de dados, como o conjunto de dados "fashion-mnist", que é um conjunto bem conhecido de imagens em escala de cinzentos de artigos de vestuário (camisas, calças, sapatos, etc.). Treinar o modelo neste conjunto de dados ensina-o a reconhecer diferentes categorias de vestuário. Podes trocar o "fashion-mnist" por qualquer conjunto de dados que se adeqúe ao teu projeto, como raças de gatos ou tipos de plantas.

__wf_reserved_inherit
Fig. 7. Treina à medida um modelo YOLO11 para classificação de imagens.

Experimenta o YOLO11 no Ultralytics HUB

Embora a utilização do pacote Ultralytics seja simples, é necessário algum conhecimento de Python. Se procuras uma opção mais amigável para principiantes, podes utilizar o Ultralytics HUB, uma plataforma concebida para tornar a formação e a implementação de diferentes modelos YOLO simples e acessíveis. Para começar, tens de criar uma conta.

Depois de iniciares sessão, navega até à secção "Modelos" e seleciona o modelo YOLO11 para a classificação da imagem. Verás uma gama de tamanhos de modelos disponíveis: nano, pequeno, médio, grande e extra-grande. Depois de escolheres um modelo, podes carregar uma imagem na secção 'Pré-visualização', onde as previsões aparecerão no lado esquerdo da página, assim que a imagem for processada.

__wf_reserved_inherit
Fig. 8. Utiliza o Ultralytics HUB para efetuar uma inferência.

Principais conclusões

YOLO11 oferece poderosas capacidades de classificação de imagens que abrem novas possibilidades em vários sectores. Desde a melhoria da monitorização das colheitas na agricultura e a melhoria das pesquisas de produtos no retalho até ao apoio à conservação da vida selvagem, a velocidade e precisão do YOLO11tornam-no ideal para diversas aplicações. Com opções de formação personalizada através do pacote Ultralytics Python ou uma configuração fácil e sem código no Ultralytics HUB, os utilizadores podem facilmente incorporar o YOLO11 nos seus fluxos de trabalho. À medida que mais indústrias adoptam soluções de IA, o YOLO11 oferece uma ferramenta flexível e de elevado desempenho que apoia a inovação e os avanços práticos.

Para explorar mais, visita o nosso repositório GitHub e participa na nossa comunidade. Explora aplicações de IA em carros autónomos e cuidados de saúde nas nossas páginas de soluções. 🚀

Logótipo do LinkedInLogótipo do TwitterLogótipo do FacebookSímbolo de ligação de cópia

Ler mais nesta categoria

Vamos construir juntos o futuro
da IA!

Começa a tua viagem com o futuro da aprendizagem automática