Aprende a utilizar o modelo Ultralytics YOLO11 para uma estimativa precisa da pose. Abordaremos a inferência em tempo real e a formação de modelos personalizados para várias aplicações.
A investigação relacionada com a visão computacional, um ramo da inteligência artificial (IA), remonta à década de 1960. No entanto, só na década de 2010, com o surgimento da aprendizagem profunda, é que assistimos a grandes avanços na forma como as máquinas compreendem as imagens. Um dos mais recentes avanços na visão computacional são os modelos de ponta Ultralytics YOLO11 modelos. Os modelosYOLO11 , apresentados pela primeira vez no evento híbrido anual Ultralytics', YOLO Vision 2024 (YV24), suportam uma série de tarefas de visão computacional, incluindo a estimativa de pose.
A estimativa de pose pode ser utilizada para detetar pontos-chave de uma pessoa ou objeto numa imagem ou vídeo para compreender a sua posição, postura ou movimento. É amplamente utilizada em aplicações como análise desportiva, monitorização do comportamento animal e robótica para ajudar as máquinas a interpretar acções físicas em tempo real. Graças à sua precisão, eficiência e velocidade melhoradas em relação aos modelos anteriores da sérieYOLO (You Only Look Once), YOLO11 é adequado para tarefas de estimativa de pose em tempo real.
Neste artigo, vamos explorar o que é a estimativa de pose, discutir algumas das suas aplicações e mostrar como podes utilizar o pacote YOLO11 com o pacoteUltralytics Python para estimativa de pose. Também veremos como podes utilizar o Ultralytics HUB para experimentar o YOLO11 e a estimativa de pose com apenas alguns cliques. Vamos começar!
Antes de nos debruçarmos sobre a forma de utilizar o novo modeloUltralytics YOLO11 para a estimativa de pose, vamos compreender melhor a estimativa de pose.
A estimativa de pose é uma técnica de visão por computador utilizada para analisar a pose de uma pessoa ou objeto numa imagem ou vídeo. Modelos de aprendizagem profunda como o YOLO11 podem identificar, localizar e seguir pontos-chave num determinado objeto ou pessoa. Para objectos, estes pontos-chave podem incluir cantos, arestas ou marcas de superfície distintas, enquanto que para os humanos, estes pontos-chave representam as principais articulações como o cotovelo, joelho ou ombro.
A estimativa de pose é única e mais complexa quando comparada com outras tarefas de visão por computador, como a deteção de objectos. Enquanto a deteção de objectos localiza os objectos numa imagem desenhando uma caixa à sua volta, a estimativa da pose vai mais longe, prevendo as posições exactas dos pontos-chave no objeto.
Quando se trata de estimativa de pose, há duas formas principais de trabalhar: de baixo para cima e de cima para baixo. A abordagem de baixo para cima detecta pontos-chave individuais e agrupa-os em esqueletos, enquanto a abordagem de cima para baixo se concentra primeiro na deteção de objectos e depois na estimativa de pontos-chave dentro deles.
YOLO11 combina os pontos fortes dos métodos de cima para baixo e de baixo para cima. Tal como a abordagem de baixo para cima, mantém as coisas simples e rápidas sem necessidade de agrupar manualmente os pontos-chave. Ao mesmo tempo, utiliza a precisão do método descendente ao detetar pessoas e estimar as suas poses num único passo.
As capacidades versáteis do YOLO11 para a estimativa de pose abrem uma vasta gama de aplicações possíveis em muitos sectores. Vamos analisar mais de perto alguns casos de utilização da estimativa de pose do YOLO11.
A segurança é um aspeto importante de qualquer projeto de construção. Isto é especialmente verdadeiro, uma vez que, estatisticamente, os estaleiros de construção registam um maior número de lesões relacionadas com o trabalho. Em 2021, cerca de 20% de todas as lesões fatais relacionadas com o trabalho ocorreram em ou perto de estaleiros de construção. Com riscos diários como equipamento pesado e sistemas eléctricos, são essenciais medidas de segurança fortes para manter os trabalhadores em segurança. Os métodos tradicionais, como a utilização de sinais, barricadas e monitorização manual por parte dos supervisores, nem sempre são eficazes e muitas vezes afastam os supervisores de tarefas mais críticas.
A IA pode intervir para melhorar a segurança e o risco de acidentes pode ser reduzido através da utilização de um sistema de monitorização de trabalhadores baseado em estimativas de pose. Ultralytics YOLO11 modelos podem ser utilizados para seguir os movimentos e as posturas dos trabalhadores. Quaisquer riscos potenciais, como trabalhadores demasiado próximos de equipamento perigoso ou a execução incorrecta de tarefas, podem ser rapidamente detectados. Se for detectado um risco, os supervisores podem ser notificados ou um alarme pode alertar o trabalhador. Um sistema de monitorização contínua pode tornar os locais de construção mais seguros, estando sempre atento aos perigos e protegendo os trabalhadores.
Os agricultores e investigadores podem utilizar o YOLO11 para estudar o movimento e o comportamento dos animais de criação, como o gado, para detetar sinais precoces de doenças como a claudicação. A claudicação é uma condição em que um animal tem dificuldade em mover-se corretamente devido a dores nas pernas ou nos pés. No gado, doenças como a claudicação não só afectam a sua saúde e bem-estar, como também conduzem a problemas de produção nas explorações leiteiras. Estudos mostram que a claudicação afeta entre 8% dos bovinos em sistemas baseados em pastagens e 15% a 30% em sistemas confinados na indústria global de laticínios. Detetar e tratar a claudicação precocemente pode ajudar a melhorar o bem-estar animal e reduzir as perdas de produção associadas a essa condição.
YOLO11podem ajudar os agricultores a seguir os padrões de marcha dos animais e a identificar rapidamente quaisquer anomalias que possam indicar problemas de saúde, como problemas nas articulações ou infecções. A deteção precoce destes problemas permite um tratamento mais rápido, reduzindo o desconforto dos animais e ajudando os agricultores a evitar perdas económicas.
Os sistemas de monitorização com visão e IA também podem ajudar a analisar o comportamento de repouso, as interações sociais e os padrões de alimentação. Os agricultores também podem utilizar a estimativa de pose para obter observações sobre sinais de stress ou agressão. Estes conhecimentos podem ser utilizados para cultivar melhores condições de vida para os animais e aumentar o seu bem-estar.
A estimativa de pose também pode ajudar as pessoas a melhorar a sua postura em tempo real enquanto fazem exercício. Com o YOLO11, os instrutores de ginásio e de ioga podem monitorizar e seguir os movimentos do corpo das pessoas que estão a fazer exercício, concentrando-se em pontos-chave como as articulações e os membros para avaliar a sua postura. Os dados recolhidos podem ser comparados com as posturas e técnicas de treino ideais, e os instrutores podem receber alertas se alguém estiver a executar um movimento incorretamente, ajudando a evitar lesões.
Por exemplo, durante uma aula de ioga, a estimativa de pose pode ajudar a monitorizar se todos os alunos estão a manter o equilíbrio e o alinhamento adequados. As aplicações móveis integradas com visão por computador e estimativa de pose podem tornar o fitness mais acessível para as pessoas que fazem exercício em casa ou para as que não têm acesso a treinadores pessoais. Este feedback contínuo em tempo real ajuda os utilizadores a melhorar a sua técnica e a atingir os seus objectivos de fitness, reduzindo simultaneamente o risco de lesões.
Agora que já explorámos o que é a estimativa de pose e discutimos algumas das suas aplicações. Vamos ver como podes experimentar a estimativa de pose com o novo modelo YOLO11 . Para começar, há duas maneiras convenientes de fazer isso: usando o pacote Ultralytics Python ou através do Ultralytics HUB. Vamos dar uma olhada nas duas opções.
A execução de uma inferência envolve o modelo YOLO11 processando novos dados fora de seus conjuntos de treinamento e usando os padrões que aprendeu para fazer previsões com base nesses dados. Podes executar inferências através do código com o pacote Ultralytics Python . Tudo o que precisas de fazer para começar é instalar o pacote Ultralytics utilizando pip, conda ou Docker. Se enfrentares algum desafio durante a instalação, o nosso Guia de Problemas Comuns oferece dicas úteis de resolução de problemas.
Depois de instalares o pacote com êxito, o código seguinte descreve como carregar um modelo e utilizá-lo para prever poses de objectos numa imagem.
Digamos que estás a trabalhar num projeto de visão por computador e tens um conjunto de dados específico para uma determinada aplicação que envolve a estimativa de pose. Depois, podes afinar e treinar um modelo YOLO11 personalizado para se adequar à tua aplicação. Por exemplo, podes utilizar um conjunto de dados de pontos-chave para analisar e compreender a pose de um tigre em imagens, identificando caraterísticas-chave como a posição dos seus membros, cabeça e cauda.
Podes utilizar o seguinte fragmento de código para carregar e treinar um modelo de estimativa de pose YOLO11 . O modelo pode ser criado a partir de uma configuração YAML, ou podes carregar um modelo pré-treinado para treino. Esse script também permite transferir pesos e começar a treinar o modelo usando um conjunto de dados especificado, como o conjunto de dados COCO para estimativa de pose.
Utilizando o modelo personalizado recém-treinado, podes executar inferências em imagens não vistas relacionadas com a tua solução de visão computacional. O modelo treinado também pode ser convertido para outros formatos utilizando o modo de exportação.
Até agora, analisámos métodos para utilizar YOLO11 que requerem alguns conhecimentos básicos de programação. Se não é isso que procuras, ou se não estás familiarizado com a codificação, há outra opção: Ultralytics HUB. Ultralytics O HUB é uma plataforma de fácil utilização concebida para simplificar o processo de formação e implementação dos modelos YOLO . O HUB permite-te gerir facilmente conjuntos de dados, treinar modelos e implementá-los sem a necessidade de conhecimentos técnicos.
Para executar inferências em imagens, podes criar uma conta, navegar para a secção 'Models' e escolher o modelo de estimativa de pose YOLO11 em que estás interessado. Na secção de pré-visualização, podes carregar uma imagem e ver os resultados da previsão, como se mostra abaixo.
Ultralytics YOLO11 oferece soluções precisas e flexíveis para tarefas como a estimativa de pose numa vasta gama de aplicações. Desde a melhoria da segurança dos trabalhadores em estaleiros de construção até à monitorização da saúde dos animais e à assistência na correção da postura em rotinas de fitness, o YOLO11 proporciona precisão e feedback em tempo real através de tecnologia avançada de visão por computador.
A sua versatilidade, com múltiplas variantes de modelos e a capacidade de formação personalizada para casos de utilização específicos, torna-o uma ferramenta muito valiosa para programadores e empresas. Seja através da codificação com o pacote Ultralytics Python ou utilizando o Ultralytics HUB para uma implementação mais fácil, YOLO11 torna a estimativa de pose acessível e impactante.
Para explorar mais, visita o nosso repositório GitHub e participa na nossa comunidade. Explora as aplicações de IA no fabrico e na agricultura nas nossas páginas de soluções. 🚀
Começa a tua viagem com o futuro da aprendizagem automática