Ao clicar em "Aceitar todos os cookies", concorda com o armazenamento de cookies no seu dispositivo para melhorar a navegação no site, analisar a utilização do site e ajudar nos nossos esforços de marketing. Mais informações
Definições de cookies
Ao clicar em "Aceitar todos os cookies", concorda com o armazenamento de cookies no seu dispositivo para melhorar a navegação no site, analisar a utilização do site e ajudar nos nossos esforços de marketing. Mais informações
Saiba como o novo modelo Ultralytics YOLO11 melhora a classificação de imagens, oferecendo uma melhor precisão para tarefas na agricultura, retalho e monitorização da vida selvagem.
Fig. 1. Um exemplo de utilização do Ultralytics YOLO11 para classificar um gato persa.
O que é a classificação de imagens?
A classificação de imagens funciona através da atribuição de uma etiqueta ou rótulo a uma imagem com base em padrões aprendidos a partir de imagens previamente rotuladas. Ao analisar cuidadosamente os pixéis de uma imagem, um modelo de visão por computador pode encontrar a melhor correspondência para a imagem. Modelos fiáveis como o YOLO11 podem lidar com este processo sem problemas. A arquitetura do modelo YOLO11 torna possível processar imagens ou fotogramas de vídeo quase instantaneamente, tornando-o ideal para aplicações que necessitem de uma classificação de imagem rápida e precisa.
Para compreender verdadeiramente o âmbito da classificação de imagens, é útil distingui-la de outras tarefas como a deteção de objectos. Enquanto a classificação de imagens rotula uma imagem inteira, a deteção de objectos identifica e localiza cada objeto dentro da imagem.
Figura 2. Comparação da classificação de imagens, deteção de objectos e segmentação de imagens.
Consideremos uma imagem de uma girafa. Na classificação de imagens, o modelo pode rotular a imagem inteira simplesmente como uma girafa com base no seu conteúdo geral. No entanto, com a deteção de objectos, o modelo não se limita a identificar a girafa; também coloca uma caixa delimitadora à volta da girafa, indicando a sua localização exacta na imagem.
Agora, imagine a girafa junto a uma árvore numa savana com outros animais. Um modelo de classificação de imagens poderia rotular toda a cena como uma savana ou apenas vida selvagem. No entanto, com a deteção de objectos, o modelo identificaria cada elemento individualmente, reconhecendo a girafa, a árvore e os outros animais, cada um com as suas próprias caixas delimitadoras.
Aplicações de classificação de imagens YOLO11
A precisão e o desempenho do modelo Ultralytics YOLO11 para classificação de imagens torna-o útil numa vasta gama de indústrias. Vamos explorar algumas das principais aplicações do YOLO11 na classificação de imagens.
Classificação de imagens YOLO11 na agricultura
A classificação de imagens pode ajudar a otimizar muitas funções na agricultura e no sector agrícola. Especificamente, utilizando modelos de classificação de imagens como o YOLO11, os agricultores podem monitorizar constantemente a saúde das suas culturas, detetar doenças graves e identificar quaisquer infestações de pragas com elevada precisão.
Processamento: Dependendo dos recursos disponíveis e da conetividade, as imagens podem ser processadas no local através de computação periférica ou carregadas para a nuvem para uma análise mais intensiva.
Classificação de imagens com YOLO11: O modelo YOLO11 pode analisar essas imagens para classificar várias condições de cultivo. As classes comuns podem incluir saudável, doente, infestado de pragas ou deficiente em nutrientes, ajudando a identificar problemas específicos que afectam diferentes áreas do campo.
Geração de insights: Com base nas classificações, o YOLO11 fornece informações sobre indicadores de saúde das culturas, ajudando os agricultores a detetar sinais precoces de doenças, identificar pontos críticos de pragas ou detetar deficiências de nutrientes.
Tomada de decisões informada: Com estas informações, os agricultores podem tomar decisões específicas sobre irrigação, fertilização e controlo de pragas, aplicando recursos apenas onde são mais necessários.
Fig. 3. Um exemplo de diferentes classes de folhas, desde saudáveis a infectadas.
Classificação de imagens YOLO11 no comércio retalhista
A classificação de imagens pode melhorar significativamente a experiência de compra no retalho, tornando-a mais personalizada e fácil de utilizar. Os retalhistas podem utilizar modelos de visão por computador treinados à medida para reconhecer produtos no seu inventário e integrar esta capacidade nas suas aplicações móveis ou websites. Os clientes podem então procurar produtos simplesmente carregando uma foto, tornando as compras mais rápidas e convenientes.
Quando um cliente carrega uma imagem para um sistema de pesquisa visual, várias coisas acontecem nos bastidores antes de aparecerem os resultados da pesquisa.
Em primeiro lugar, a deteção de objectos pode ser utilizada para escolher os itens principais da imagem, como identificar uma peça de roupa ou uma peça de mobiliário e separá-la do fundo. Em seguida, a classificação da imagem pode ser utilizada para categorizar ainda mais cada item, reconhecendo se é um casaco, uma camisa, um sofá ou uma mesa.
Com esta informação, o sistema pode obter produtos semelhantes disponíveis para compra, o que é especialmente útil para encontrar artigos únicos ou da moda que são difíceis de descrever apenas com palavras. A mesma tecnologia também pode ajudar a simplificar outras tarefas de retalho, como a gestão de inventário, reconhecendo e categorizando automaticamente os artigos.
Fig. 4. Uma plataforma de pesquisa visual baseada na classificação de imagens em ação.
Monitorização da vida selvagem com classificação de imagens YOLO11
Tradicionalmente, a monitorização de animais na natureza é uma tarefa fastidiosa que envolve muitas pessoas que selecionam e analisam manualmente milhares de fotografias. Com modos de visão por computador como o YOLO11, os investigadores podem monitorizar automaticamente os animais a um ritmo mais rápido. As câmaras podem ser colocadas em habitats naturais para tirar fotografias. O modelo de IA de visão pode então ser utilizado para analisar essas fotografias e classificar os animais nelas contidos (se existirem). Este sistema pode ajudar os investigadores a estudar e a seguir as populações de animais, os seus padrões de migração, etc.
Outra forma de os modelos de IA e de visão por computador como o YOLO11 poderem ajudar neste domínio é simplificando o processo de classificação das espécies ameaçadas. Ao identificar potenciais espécies ou categorias de raças a que um animal pode pertencer, estes modelos podem fornecer dados essenciais aos investigadores. Por exemplo, a Universidade da Tasmânia (UTAS) desenvolveu um sistema baseado na classificação de imagens para monitorizar diferentes animais selvagens da Tasmânia. As previsões dos modelos podem ajudar os cientistas e investigadores a manterem-se atentos à atividade e ao comportamento dos animais, o que pode indicar ameaças como a caça furtiva ou a perda de habitat.
Fig. 5. YOLO11 prevê as possíveis raças a que um cão pode pertencer.
Experimentar a classificação de imagens com o modelo YOLO11
Agora que já falámos sobre o que é a classificação de imagens e explorámos algumas das suas aplicações. Vamos ver como pode experimentar a classificação de imagens com o novo modelo YOLO11. Existem duas formas fáceis de começar: utilizando o pacote Ultralytics Python ou através do Ultralytics HUB. Iremos analisar as duas opções.
Assim que o pacote estiver instalado, pode utilizar o seguinte código para carregar uma variante do modelo de classificação de imagens YOLO11 e executar uma inferência numa imagem. Executar uma inferência significa usar um modelo treinado para fazer previsões em dados novos e não vistos. Pode experimentar com uma imagem à sua escolha!
Fig. 6. Execução de inferências utilizando o modelo YOLO11.
Treinar um modelo de classificação YOLO11 personalizado
Também pode utilizar o mesmo pacote Python para treinar um modelo de classificação YOLO11 personalizado. O treino personalizado permite-lhe afinar um modelo YOLO11 para as suas necessidades específicas. Por exemplo, se estiver a desenvolver uma aplicação para classificar diferentes raças de gatos, pode treinar um modelo YOLO11 personalizado apenas para esse fim.
O código abaixo mostra como carregar e treinar um modelo de classificação de imagens YOLO11. Permite-lhe transferir pesos pré-treinados, utilizando o conhecimento de um modelo existente para aumentar o desempenho do seu próprio modelo. Pode especificar um conjunto de dados, como o conjunto de dados "fashion-mnist", que é um conjunto bem conhecido de imagens em escala de cinzentos de artigos de vestuário (camisas, calças, sapatos, etc.). O treino do modelo neste conjunto de dados ensina-o a reconhecer diferentes categorias de vestuário. Pode trocar "fashion-mnist" por qualquer conjunto de dados que se adeqúe ao seu projeto, como raças de gatos ou tipos de plantas.
Fig. 7. Treino personalizado de um modelo YOLO11 para classificação de imagens.
Experimente o YOLO11 no Ultralytics HUB
Embora a utilização do pacote Ultralytics seja simples, requer alguns conhecimentos de Python. Se estiver à procura de uma opção mais amigável para principiantes, pode utilizar o Ultralytics HUB, uma plataforma concebida para tornar a formação e a implementação de diferentes modelos YOLO simples e acessíveis. Para começar, é necessário criar uma conta.
Depois de iniciar sessão, navegue até à secção "Modelos" e selecione o modelo YOLO11 para classificação de imagens. Verá uma gama de tamanhos de modelos disponíveis: nano, pequeno, médio, grande e extra-grande. Depois de escolher um modelo, pode carregar uma imagem na secção 'Pré-visualização', onde as previsões aparecerão no lado esquerdo da página assim que a imagem for processada.
Fig. 8. Utilização do Ultralytics HUB para efetuar uma inferência.
Principais conclusões
O YOLO11 oferece poderosas capacidades de classificação de imagens que abrem novas possibilidades em vários sectores. Desde a melhoria da monitorização das colheitas na agricultura e a melhoria das pesquisas de produtos no retalho até ao apoio à conservação da vida selvagem, a velocidade e a precisão do YOLO11 tornam-no ideal para diversas aplicações. Com opções de formação personalizada através do pacote Ultralytics Python ou uma configuração fácil e sem código no Ultralytics HUB, os utilizadores podem facilmente incorporar o YOLO11 nos seus fluxos de trabalho. À medida que mais indústrias adoptam soluções de IA, o YOLO11 oferece uma ferramenta flexível e de elevado desempenho que apoia a inovação e os avanços práticos.