Aprende como o novo modelo Ultralytics YOLO11 melhora a classificação de imagens, oferecendo uma melhor precisão para tarefas na agricultura, retalho e monitorização da vida selvagem.
Digamos que um robô está a olhar para dois gatos, um preto e um branco, e precisa de descobrir qual é qual. Para o fazer, pode utilizar a classificação de imagens, uma tarefa de visão por computador que ajuda a identificar e categorizar objectos ou cenas numa imagem. De facto, graças aos recentes avanços na inteligência artificial (IA), a classificação de imagens pode ser utilizada numa grande variedade de aplicações, desde a monitorização de animais à produção e à agricultura, com a deteção de doenças nas culturas.
Um dos mais recentes avanços na classificação de imagens é o modeloUltralytics YOLO11 . Lançado no evento híbrido anual daUltralytics, YOLO Vision 2024 (YV24), YOLO11 foi concebido para lidar com uma grande variedade de tarefas de IA de visão, incluindo a classificação de imagens, com facilidade e precisão.
Neste artigo, vamos explorar os fundamentos da classificação de imagens, discutir aplicações do mundo real e mostrar-te como podes utilizar o YOLO11 para classificação de imagens através do pacoteUltralytics Python . Também veremos como podes experimentar as capacidades doYOLO11 no HUB Ultralytics em alguns passos simples. Vamos começar!
A classificação de imagens funciona atribuindo um rótulo ou etiqueta a uma imagem com base em padrões aprendidos a partir de imagens previamente rotuladas. Ao analisar cuidadosamente os pixéis de uma imagem, um modelo de visão por computador pode encontrar a melhor correspondência para a imagem. Modelos fiáveis como o YOLO11 podem lidar com este processo sem problemas. YOLO11A arquitetura do modelo do 's torna possível processar imagens ou fotogramas de vídeo quase instantaneamente, tornando-o ideal para aplicações que necessitem de uma classificação de imagens rápida e precisa.
Para compreender verdadeiramente o âmbito da classificação de imagens, é útil distingui-la de outras tarefas como a deteção de objectos. Enquanto a classificação de imagens rotula uma imagem inteira, a deteção de objectos identifica e localiza cada objeto dentro da imagem.
Consideremos uma imagem de uma girafa. Na classificação de imagens, o modelo pode rotular a imagem inteira simplesmente como uma girafa com base no seu conteúdo geral. No entanto, com a deteção de objectos, o modelo não se limita a identificar a girafa; também coloca uma caixa delimitadora à volta da girafa, indicando a sua localização exacta na imagem.
Agora, imagina a girafa junto a uma árvore numa savana com outros animais. Um modelo de classificação de imagens poderia rotular toda a cena como uma savana ou apenas vida selvagem. No entanto, com a deteção de objectos, o modelo identificaria cada elemento individualmente, reconhecendo a girafa, a árvore e os outros animais, cada um com as suas próprias caixas delimitadoras.
A precisão e o desempenho do modelo Ultralytics YOLO11 para classificação de imagens torna-o útil numa vasta gama de indústrias. Vamos explorar algumas das principais aplicações do YOLO11 na classificação de imagens.
A classificação de imagens pode ajudar a otimizar muitas funções na agricultura e na indústria agrícola. Especificamente, utilizando modelos de classificação de imagens como YOLO11, os agricultores podem monitorizar constantemente a saúde das suas culturas, detetar doenças graves e identificar quaisquer infestações de pragas com elevada precisão.
Vê aqui como isto funciona:
A classificação de imagens pode melhorar significativamente a experiência de compra no retalho, tornando-a mais personalizada e fácil de utilizar. Os retalhistas podem utilizar modelos de visão computacional treinados à medida para reconhecer produtos no seu inventário e integrar esta capacidade nas suas aplicações móveis ou websites. Os clientes podem então procurar produtos simplesmente carregando uma foto, tornando as compras mais rápidas e convenientes.
Quando um cliente carrega uma imagem para um sistema de pesquisa visual, várias coisas acontecem nos bastidores antes de aparecerem os resultados da pesquisa.
Primeiro, a deteção de objectos pode ser utilizada para escolher os itens principais na imagem, como identificar uma peça de roupa ou uma peça de mobiliário e separá-la do fundo. Em seguida, a classificação da imagem pode ser utilizada para categorizar ainda mais cada item, reconhecendo se é um casaco, uma camisa, um sofá ou uma mesa.
Com esta informação, o sistema pode obter produtos semelhantes disponíveis para compra, o que é especialmente útil para encontrar artigos únicos ou da moda que são difíceis de descrever apenas com palavras. A mesma tecnologia também pode ajudar a simplificar outras tarefas de retalho, como a gestão de inventário, reconhecendo e categorizando automaticamente os artigos.
Tradicionalmente, a monitorização de animais em estado selvagem é uma tarefa fastidiosa que envolve muitas pessoas que selecionam e analisam manualmente milhares de fotografias. Com modos de visão por computador como YOLO11, os investigadores podem monitorizar automaticamente os animais a um ritmo mais rápido. As câmaras podem ser colocadas em habitats naturais para tirar fotografias. O modelo de visão da IA pode então ser utilizado para analisar estas fotografias e classificar os animais nelas presentes (se existirem). Este sistema pode ajudar os investigadores a estudar e a seguir as populações de animais, os seus padrões de migração, etc.
Outra forma de a IA e os modelos de visão por computador, como o YOLO11 , poderem ajudar neste domínio é simplificando o processo de classificação das espécies ameaçadas de extinção. Ao identificar potenciais espécies ou categorias de raças a que um animal pode pertencer, estes modelos podem fornecer dados essenciais aos investigadores. Por exemplo, a Universidade da Tasmânia (UTAS) desenvolveu um sistema baseado na classificação de imagens para monitorizar diferentes animais selvagens da Tasmânia. As previsões dos modelos podem ajudar os cientistas e investigadores a manterem-se atentos à atividade e ao comportamento dos animais, o que pode indicar ameaças como a caça furtiva ou a perda de habitat.
Agora que já falámos sobre o que é a classificação de imagens e explorámos algumas das suas aplicações. Vamos ver como podes experimentar a classificação de imagens com o novo modelo YOLO11 . Há duas maneiras fáceis de começar: usando o pacoteUltralytics Python ou através do Ultralytics HUB. Vamos examinar as duas opções.
Para começar a usar o pacote Ultralytics Python , basta instalá-lo usando pip, conda ou Docker. Se tiveres algum problema, consulta o nosso Guia de Problemas Comuns para obteres dicas úteis de resolução de problemas.
Assim que o pacote estiver instalado, podes utilizar o seguinte código para carregar uma variante do modelo de classificação de imagens YOLO11 e executar uma inferência numa imagem. Executar uma inferência significa usar um modelo treinado para fazer previsões em dados novos e não vistos. Podes experimentar com uma imagem à tua escolha!
Também podes utilizar o mesmo pacote Python para treinar um modelo de classificação YOLO11 personalizado. O treino personalizado permite-te afinar um modelo YOLO11 para as tuas necessidades específicas. Por exemplo, se estiveres a desenvolver uma aplicação para classificar diferentes raças de gatos, podes treinar um modelo YOLO11 personalizado apenas para esse fim.
O código abaixo mostra como carregar e treinar um modelo de classificação de imagens YOLO11 . Permite-te transferir pesos pré-treinados, utilizando o conhecimento de um modelo existente para aumentar o desempenho do teu próprio modelo. Podes especificar um conjunto de dados, como o conjunto de dados "fashion-mnist", que é um conjunto bem conhecido de imagens em escala de cinzentos de artigos de vestuário (camisas, calças, sapatos, etc.). Treinar o modelo neste conjunto de dados ensina-o a reconhecer diferentes categorias de vestuário. Podes trocar o "fashion-mnist" por qualquer conjunto de dados que se adeqúe ao teu projeto, como raças de gatos ou tipos de plantas.
Embora a utilização do pacote Ultralytics seja simples, é necessário algum conhecimento de Python. Se procuras uma opção mais amigável para principiantes, podes utilizar o Ultralytics HUB, uma plataforma concebida para tornar a formação e a implementação de diferentes modelos YOLO simples e acessíveis. Para começar, tens de criar uma conta.
Depois de iniciares sessão, navega até à secção "Modelos" e seleciona o modelo YOLO11 para a classificação da imagem. Verás uma gama de tamanhos de modelos disponíveis: nano, pequeno, médio, grande e extra-grande. Depois de escolheres um modelo, podes carregar uma imagem na secção 'Pré-visualização', onde as previsões aparecerão no lado esquerdo da página, assim que a imagem for processada.
YOLO11 oferece poderosas capacidades de classificação de imagens que abrem novas possibilidades em vários sectores. Desde a melhoria da monitorização das colheitas na agricultura e a melhoria das pesquisas de produtos no retalho até ao apoio à conservação da vida selvagem, a velocidade e precisão do YOLO11tornam-no ideal para diversas aplicações. Com opções de formação personalizada através do pacote Ultralytics Python ou uma configuração fácil e sem código no Ultralytics HUB, os utilizadores podem facilmente incorporar o YOLO11 nos seus fluxos de trabalho. À medida que mais indústrias adoptam soluções de IA, o YOLO11 oferece uma ferramenta flexível e de elevado desempenho que apoia a inovação e os avanços práticos.
Para explorar mais, visita o nosso repositório GitHub e participa na nossa comunidade. Explora aplicações de IA em carros autónomos e cuidados de saúde nas nossas páginas de soluções. 🚀
Começa a tua viagem com o futuro da aprendizagem automática