Verificação verde
Link copiado para a área de transferência

Como utilizar Ultralytics YOLO11 para a classificação de imagens

Aprende como o novo modelo Ultralytics YOLO11 melhora a classificação de imagens, oferecendo uma melhor precisão para tarefas na agricultura, retalho e monitorização da vida selvagem.

Digamos que um robô está a olhar para dois gatos, um preto e um branco, e precisa de descobrir qual é qual. Para o fazer, pode utilizar a classificação de imagens, uma tarefa de visão por computador que ajuda a identificar e categorizar objectos ou cenas numa imagem. De facto, graças aos recentes avanços na inteligência artificial (IA), a classificação de imagens pode ser utilizada numa grande variedade de aplicações, desde a monitorização de animais à produção e à agricultura, com a deteção de doenças nas culturas.

Um dos mais recentes avanços na classificação de imagens é o modeloUltralytics YOLO11 . Lançado no evento híbrido anual daUltralytics, YOLO Vision 2024 (YV24), YOLO11 foi concebido para lidar com uma grande variedade de tarefas de IA de visão, incluindo a classificação de imagens, com facilidade e precisão.

Neste artigo, vamos explorar os fundamentos da classificação de imagens, discutir aplicações do mundo real e mostrar-te como podes utilizar o YOLO11 para classificação de imagens através do pacoteUltralytics Python . Também veremos como podes experimentar as capacidades doYOLO11 no HUB Ultralytics em alguns passos simples. Vamos começar!

Fig. 1. Um exemplo de utilização de Ultralytics YOLO11 para classificar um gato persa.

O que é a classificação de imagens?

A classificação de imagens funciona atribuindo um rótulo ou etiqueta a uma imagem com base em padrões aprendidos a partir de imagens previamente rotuladas. Ao analisar cuidadosamente os pixéis de uma imagem, um modelo de visão por computador pode encontrar a melhor correspondência para a imagem. Modelos fiáveis como o YOLO11 podem lidar com este processo sem problemas. YOLO11A arquitetura do modelo do 's torna possível processar imagens ou fotogramas de vídeo quase instantaneamente, tornando-o ideal para aplicações que necessitem de uma classificação de imagens rápida e precisa.

Para compreender verdadeiramente o âmbito da classificação de imagens, é útil distingui-la de outras tarefas como a deteção de objectos. Enquanto a classificação de imagens rotula uma imagem inteira, a deteção de objectos identifica e localiza cada objeto dentro da imagem. 

Figura 2. Comparação da classificação de imagens, deteção de objectos e segmentação de imagens.

Consideremos uma imagem de uma girafa. Na classificação de imagens, o modelo pode rotular a imagem inteira simplesmente como uma girafa com base no seu conteúdo geral. No entanto, com a deteção de objectos, o modelo não se limita a identificar a girafa; também coloca uma caixa delimitadora à volta da girafa, indicando a sua localização exacta na imagem.

Agora, imagina a girafa junto a uma árvore numa savana com outros animais. Um modelo de classificação de imagens poderia rotular toda a cena como uma savana ou apenas vida selvagem. No entanto, com a deteção de objectos, o modelo identificaria cada elemento individualmente, reconhecendo a girafa, a árvore e os outros animais, cada um com as suas próprias caixas delimitadoras.

YOLO11 Aplicações de classificação de imagens

A precisão e o desempenho do modelo Ultralytics YOLO11 para classificação de imagens torna-o útil numa vasta gama de indústrias. Vamos explorar algumas das principais aplicações do YOLO11 na classificação de imagens.

YOLO11 Classificação de imagens na agricultura

A classificação de imagens pode ajudar a otimizar muitas funções na agricultura e na indústria agrícola. Especificamente, utilizando modelos de classificação de imagens como YOLO11, os agricultores podem monitorizar constantemente a saúde das suas culturas, detetar doenças graves e identificar quaisquer infestações de pragas com elevada precisão. 

Vê aqui como isto funciona:

  • Captura de imagens: Os dispositivos da Internet das Coisas (IoT), como câmaras e drones, podem ser utilizados para captar imagens em tempo real das culturas a partir de vários ângulos e localizações nos campos.
  • Processamento: Dependendo dos recursos disponíveis e da conetividade, as imagens podem ser processadas no local através de computação periférica ou carregadas para a nuvem para uma análise mais intensiva.
  • Classificação de imagens com YOLO11: O modelo YOLO11 pode analisar estas imagens para classificar várias condições de cultivo. As classes comuns podem incluir saudável, doente, infestado de pragas ou deficiente em nutrientes, ajudando a identificar problemas específicos que afectam diferentes áreas do campo.
  • Geração de informações: Com base nas classificações, YOLO11 fornece informações sobre os indicadores de saúde das culturas, ajudando os agricultores a detetar sinais precoces de doenças, a identificar focos de pragas ou a detetar deficiências de nutrientes.
  • Tomada de decisões informada: Com estas informações, os agricultores podem tomar decisões específicas sobre irrigação, fertilização e controlo de pragas, aplicando recursos apenas onde são mais necessários.
Fig. 3. Um exemplo de diferentes classes de folhas, de saudáveis a infectadas.

YOLO11 Classificação de imagens no retalho

A classificação de imagens pode melhorar significativamente a experiência de compra no retalho, tornando-a mais personalizada e fácil de utilizar. Os retalhistas podem utilizar modelos de visão computacional treinados à medida para reconhecer produtos no seu inventário e integrar esta capacidade nas suas aplicações móveis ou websites. Os clientes podem então procurar produtos simplesmente carregando uma foto, tornando as compras mais rápidas e convenientes.

Quando um cliente carrega uma imagem para um sistema de pesquisa visual, várias coisas acontecem nos bastidores antes de aparecerem os resultados da pesquisa. 

Primeiro, a deteção de objectos pode ser utilizada para escolher os itens principais na imagem, como identificar uma peça de roupa ou uma peça de mobiliário e separá-la do fundo. Em seguida, a classificação da imagem pode ser utilizada para categorizar ainda mais cada item, reconhecendo se é um casaco, uma camisa, um sofá ou uma mesa. 

Com esta informação, o sistema pode obter produtos semelhantes disponíveis para compra, o que é especialmente útil para encontrar artigos únicos ou da moda que são difíceis de descrever apenas com palavras. A mesma tecnologia também pode ajudar a simplificar outras tarefas de retalho, como a gestão de inventário, reconhecendo e categorizando automaticamente os artigos.

Figura 4. Uma plataforma de pesquisa visual baseada na classificação de imagens em ação.

Monitorização da vida selvagem com YOLO11 Classificação de imagens

Tradicionalmente, a monitorização de animais em estado selvagem é uma tarefa fastidiosa que envolve muitas pessoas que selecionam e analisam manualmente milhares de fotografias. Com modos de visão por computador como YOLO11, os investigadores podem monitorizar automaticamente os animais a um ritmo mais rápido. As câmaras podem ser colocadas em habitats naturais para tirar fotografias. O modelo de visão da IA pode então ser utilizado para analisar estas fotografias e classificar os animais nelas presentes (se existirem). Este sistema pode ajudar os investigadores a estudar e a seguir as populações de animais, os seus padrões de migração, etc.

Outra forma de a IA e os modelos de visão por computador, como o YOLO11 , poderem ajudar neste domínio é simplificando o processo de classificação das espécies ameaçadas de extinção. Ao identificar potenciais espécies ou categorias de raças a que um animal pode pertencer, estes modelos podem fornecer dados essenciais aos investigadores. Por exemplo, a Universidade da Tasmânia (UTAS) desenvolveu um sistema baseado na classificação de imagens para monitorizar diferentes animais selvagens da Tasmânia. As previsões dos modelos podem ajudar os cientistas e investigadores a manterem-se atentos à atividade e ao comportamento dos animais, o que pode indicar ameaças como a caça furtiva ou a perda de habitat

Fig 5. YOLO11 prevê as possíveis raças a que um cão pode pertencer.

Experimenta a classificação de imagens com o modelo YOLO11

Agora que já falámos sobre o que é a classificação de imagens e explorámos algumas das suas aplicações. Vamos ver como podes experimentar a classificação de imagens com o novo modelo YOLO11 . Há duas maneiras fáceis de começar: usando o pacoteUltralytics Python ou através do Ultralytics HUB. Vamos examinar as duas opções.

Executar inferências usando YOLO11

Para começar a usar o pacote Ultralytics Python , basta instalá-lo usando pip, conda ou Docker. Se tiveres algum problema, consulta o nosso Guia de Problemas Comuns para obteres dicas úteis de resolução de problemas.

Assim que o pacote estiver instalado, podes utilizar o seguinte código para carregar uma variante do modelo de classificação de imagens YOLO11 e executar uma inferência numa imagem. Executar uma inferência significa usar um modelo treinado para fazer previsões em dados novos e não vistos. Podes experimentar com uma imagem à tua escolha!

Fig. 6. Executa inferências utilizando o modelo YOLO11 .

Treina um modelo de classificação personalizado YOLO11

Também podes utilizar o mesmo pacote Python para treinar um modelo de classificação YOLO11 personalizado. O treino personalizado permite-te afinar um modelo YOLO11 para as tuas necessidades específicas. Por exemplo, se estiveres a desenvolver uma aplicação para classificar diferentes raças de gatos, podes treinar um modelo YOLO11 personalizado apenas para esse fim.

O código abaixo mostra como carregar e treinar um modelo de classificação de imagens YOLO11 . Permite-te transferir pesos pré-treinados, utilizando o conhecimento de um modelo existente para aumentar o desempenho do teu próprio modelo. Podes especificar um conjunto de dados, como o conjunto de dados "fashion-mnist", que é um conjunto bem conhecido de imagens em escala de cinzentos de artigos de vestuário (camisas, calças, sapatos, etc.). Treinar o modelo neste conjunto de dados ensina-o a reconhecer diferentes categorias de vestuário. Podes trocar o "fashion-mnist" por qualquer conjunto de dados que se adeqúe ao teu projeto, como raças de gatos ou tipos de plantas.

Fig. 7. Treina à medida um modelo YOLO11 para classificação de imagens.

Experimenta YOLO11 em Ultralytics HUB

Embora a utilização do pacote Ultralytics seja simples, é necessário algum conhecimento de Python. Se procuras uma opção mais amigável para principiantes, podes utilizar o Ultralytics HUB, uma plataforma concebida para tornar a formação e a implementação de diferentes modelos YOLO simples e acessíveis. Para começar, tens de criar uma conta.

Depois de iniciares sessão, navega até à secção "Modelos" e seleciona o modelo YOLO11 para a classificação da imagem. Verás uma gama de tamanhos de modelos disponíveis: nano, pequeno, médio, grande e extra-grande. Depois de escolheres um modelo, podes carregar uma imagem na secção 'Pré-visualização', onde as previsões aparecerão no lado esquerdo da página, assim que a imagem for processada.

Fig. 8. Utiliza o Ultralytics HUB para efetuar uma inferência.

Principais conclusões

YOLO11 oferece poderosas capacidades de classificação de imagens que abrem novas possibilidades em vários sectores. Desde a melhoria da monitorização das colheitas na agricultura e a melhoria das pesquisas de produtos no retalho até ao apoio à conservação da vida selvagem, a velocidade e precisão do YOLO11tornam-no ideal para diversas aplicações. Com opções de formação personalizada através do pacote Ultralytics Python ou uma configuração fácil e sem código no Ultralytics HUB, os utilizadores podem facilmente incorporar o YOLO11 nos seus fluxos de trabalho. À medida que mais indústrias adoptam soluções de IA, o YOLO11 oferece uma ferramenta flexível e de elevado desempenho que apoia a inovação e os avanços práticos.

Para explorar mais, visita o nosso repositório GitHub e participa na nossa comunidade. Explora aplicações de IA em carros autónomos e cuidados de saúde nas nossas páginas de soluções. 🚀

Logótipo do FacebookLogótipo do TwitterLogótipo do LinkedInSímbolo de ligação de cópia

Ler mais nesta categoria

Vamos construir juntos o futuro
da IA!

Começa a tua viagem com o futuro da aprendizagem automática