Verificação verde
Link copiado para a área de transferência

Como calcular a distância utilizando modelos de visão por computador?

Aprende como o cálculo da distância em aplicações de visão por computador utilizando o Ultralytics YOLO11 ajuda a medir a proximidade de objectos em tempo real.

Quando estás a atravessar a estrada e vês um carro a vir na tua direção, consegues saber instantaneamente a que distância está. Este julgamento rápido, quase instintivo, deve-se a uma compreensão espacial do que te rodeia. Com base neste sentido, podes decidir se deves acelerar, parar ou continuar a andar. 

Do mesmo modo, a visão por computador é um ramo da inteligência artificial (IA) que permite às máquinas compreenderem o que as rodeia através da interpretação de dados visuais. Tal como podes avaliar a proximidade de um carro para tomar decisões rápidas, os modelos de visão por computador podem analisar imagens e vídeos, ajudando as máquinas a sentir e a reagir ao mundo que as rodeia.

Por exemplo, Ultralytics YOLO11 é um modelo de visão por computador que pode detetar e seguir objectos em imagens e vídeos em tempo real. Simplificando, YOLO11 funciona olhando para toda a imagem de uma só vez, e não em partes, o que o torna mais rápido e mais eficiente. Também pode lidar com tarefas de visão computacional como segmentação de instâncias, estimativa de pose e classificação de imagens.

Em particular, as capacidades do YOLO11 podem ser utilizadas para calcular a distância entre objectos, o que é útil em muitas áreas como a produção, o comércio e a gestão de multidões, ajudando a melhorar a segurança e a eficiência.

Neste artigo, vamos explorar a forma como YOLO11 pode ser utilizado para o cálculo de distâncias em aplicações de visão por computador, a sua importância e o seu impacto em diferentes indústrias.

Figura 1. Um exemplo de utilização do YOLO para calcular a distância de aterragem de um avião.

Uma visão geral do cálculo da distância na visão por computador

O cálculo da distância na visão por computador envolve a deteção, localização e medição dos pixels entre dois objectos numa imagem. Os pixéis são as unidades individuais que compõem uma imagem digital, cada uma representando um único ponto com uma cor ou valor de intensidade específicos. 

Para converteres as medições de píxeis em distâncias reais, a calibragem é fundamental. Podes pensar nisso como usar uma régua para medir algo e depois usar essa medida para compreender o tamanho de outros objectos. Ao fazer referência a objectos com tamanhos conhecidos, a calibragem cria uma ligação entre os pixels e as distâncias físicas reais.

Vejamos um exemplo para perceberes como isto funciona. Na imagem abaixo, a moeda é o objeto de referência e o seu tamanho (0,9 pol. por 1,0 pol.) é conhecido. Comparando as medidas dos pixels dos outros objectos com o tamanho da moeda, podemos calcular o seu tamanho real.

Figura 2. Uma moeda pode ser utilizada como referência para medir o tamanho real de outros objectos.

No entanto, o cálculo da distância é efectuado num plano bidimensional (2D), o que significa que apenas mede as distâncias horizontais e verticais entre objectos. Isto é diferente da estimativa de profundidade, que mede a distância dos objectos no espaço tridimensional, incluindo a sua distância da câmara.

Embora as câmaras de profundidade possam medir a profundidade real e fornecer informações espaciais mais detalhadas, em muitos casos, uma simples distância calibrada é suficiente. Por exemplo, saber a distância entre objectos num plano 2D funciona bem em tarefas como o seguimento de objectos ou a gestão de filas de espera, pelo que a estimativa de profundidade não é necessária nessas situações.

Compreender como funciona o cálculo da distância com o YOLO11

A seguir, vamos ver como calcular a distância entre dois objectos utilizando o suporte do YOLO11para deteção e seguimento de objectos. Aqui tens um resumo:

  • Detetar e seguir objectos: YOLO11 pode ser utilizado para detetar objectos, reconhecendo-os num fotograma e acompanhando o seu movimento ao longo dos fotogramas de um vídeo. Atribui um ID de pista único a cada objeto, permitindo ao sistema monitorizar a sua posição e movimento ao longo do vídeo.
  • Caixas de contorno: As caixas delimitadoras são desenhadas à volta dos objectos detectados com base nos resultados de deteção de objectos do YOLO11, que definem a sua localização na imagem.
  • Seleção de objectos: Podem ser selecionados dois objectos para focar, e YOLO11 actualiza as caixas delimitadoras à medida que os objectos se movem em tempo real.
  • Cálculo do centroide: Os centróides (os pontos centrais das caixas delimitadoras dos dois objectos) são calculados com base nas coordenadas dos cantos das caixas delimitadoras, que representam as posições dos objectos.
  • Cálculo da distância: Os centróides dos dois objectos podem então ser utilizados para calcular a distância euclidiana entre eles. A distância euclidiana é a distância em linha reta entre dois pontos num plano 2D, calculada utilizando as diferenças nas direcções horizontal e vertical. Isto fornece a distância entre os dois objectos em pixels.

É importante ter em conta que as distâncias calculadas com este método são apenas estimativas, uma vez que se baseiam em medições de pixéis 2D.

Fig. 3. Utiliza o Ultralytics YOLO para detetar uma pessoa e calcular distâncias. 

O impacto da estimativa de distância YOLO

Considerando que o cálculo de distâncias com o YOLO11 é uma estimativa, podes estar a pensar: Onde é que isto pode ser utilizado e como é que pode fazer a diferença? 

Uma vez que são utilizadas calibrações para chegar a estas estimativas de distância, estas são suficientemente precisas para ajudar em muitas situações práticas. A estimativa de distância do YOLO11é particularmente útil em ambientes dinâmicos, como armazéns, onde os objectos estão constantemente em movimento e são necessários ajustes em tempo real para manter as coisas a funcionar sem problemas.

Um exemplo interessante é a utilização do YOLO11 para localizar pacotes numa correia transportadora e estimar a distância entre eles em tempo real. Isto ajuda os gestores de armazém a certificarem-se de que as embalagens estão devidamente espaçadas, evitando colisões e mantendo as coisas a funcionar sem problemas. 

Nestes casos, nem sempre é necessária uma distância exacta. Normalmente, é definido um intervalo ou limite para a distância ideal, pelo que uma estimativa funciona bem para este tipo de aplicações.

Fig. 4. Detecta os pacotes utilizando YOLO11 e calcula a distância entre eles.

Cálculo da distância em aplicações de visão por computador

Várias aplicações de visão por computador podem beneficiar do cálculo da distância entre objectos utilizando o YOLO11. Na análise de retalho, por exemplo, ajuda a melhorar a gestão de filas de espera, acompanhando as posições dos clientes em tempo real. Isso possibilita que as empresas aloquem melhor os recursos, reduzam os tempos de espera e criem uma experiência de compra mais suave. Ao ajustar dinamicamente os níveis de pessoal e gerir o fluxo de clientes, as lojas podem evitar a sobrelotação e otimizar a utilização do espaço.

Do mesmo modo, na gestão do tráfego, a estimativa da distância ajuda a monitorizar o espaçamento entre veículos e a analisar os padrões de tráfego. Esta informação pode ser utilizada para detetar comportamentos perigosos, como o "tailgating", e ajustar os sinais de trânsito para manter o tráfego a fluir sem problemas. Pode ajudar a tornar as estradas mais seguras, identificando potenciais problemas e melhorando a gestão global do tráfego em tempo real.

Fig. 5. O cálculo da distância com visão pode ser utilizado para monitorizar o tráfego.

Outra utilização única desta tecnologia ocorreu durante a pandemia da COVID-19, quando ajudou a promover o distanciamento social. Assegurava que as pessoas mantinham uma distância segura em espaços públicos, lojas e hospitais, reduzindo o risco de propagação do vírus. 

Ao monitorizar as distâncias em tempo real, podem ser enviados alertas quando as pessoas estão demasiado próximas, facilitando a resposta rápida das empresas e dos prestadores de cuidados de saúde e mantendo um ambiente mais seguro para todos.

Prós e contras do cálculo da distância na visão por computador

Agora que já discutimos algumas das aplicações do cálculo de distâncias utilizando a visão por computador, analisa mais detalhadamente as vantagens associadas a este processo:

  • Automatização: A IA de visão pode automatizar tarefas de cálculo de distância que, de outra forma, exigiriam rastreamento manual, reduzindo o erro humano e os custos de mão de obra e aumentando a produtividade.
  • Otimização de recursos: Ao conhecer o espaçamento aproximado e a proximidade dos objectos, os recursos (como pessoal ou maquinaria) podem ser optimizados, reduzindo o desperdício e melhorando os fluxos de trabalho.
  • Complexidade mínima de configuração: Uma vez configurados, os sistemas de cálculo de distância com visão são de manutenção relativamente baixa e requerem menos intervenção humana em comparação com outros sistemas que dependem de entrada manual ou maquinaria complexa.

Apesar destas vantagens, existem também algumas limitações a ter em conta ao implementar estes sistemas. Segue-se uma breve descrição dos principais factores a ter em conta quando se trata do cálculo da distância utilizando a visão por computador:

  • Sensibilidade a factores ambientais: A precisão do cálculo da distância pode ser afetada por condições de iluminação, sombras, reflexos ou obstruções, levando a potenciais erros ou inconsistências.
  • Preocupações com a privacidade: A utilização da visão por computador para localizar objectos ou pessoas pode levantar questões de privacidade, especialmente em espaços públicos ou ambientes sensíveis onde possam estar envolvidos dados pessoais.
  • Complexidade em cenários com vários objectos: Em ambientes com muitos objectos em movimento, o cálculo preciso das distâncias entre vários objectos em simultâneo pode gerar confusão, especialmente se estiverem próximos ou em intersecção.

Principais conclusões

O cálculo da distância entre objectos utilizando o YOLO11 é uma solução fiável que pode apoiar a tomada de decisões. É especialmente útil em ambientes dinâmicos como armazéns, retalho e gestão de tráfego, onde o controlo da proximidade de objectos pode melhorar a eficiência e a segurança. 

YOLO11 torna possível automatizar tarefas que normalmente exigiriam esforço manual. Embora existam alguns desafios, como a sensibilidade a factores ambientais e preocupações com a privacidade, os benefícios, como a automatização, a escalabilidade e a fácil integração, tornam-no impactante. À medida que a visão computacional continua a melhorar, especialmente em áreas como o cálculo de distâncias, é provável que assistamos a uma verdadeira mudança na forma como as máquinas interagem e compreendem o que as rodeia.

Junta-te à nossa comunidade! Explora o nosso repositório GitHub para saberes mais sobre a IA de visão. Se estiveres interessado em tirar partido da visão computacional, consulta as nossas opções de licenciamento. Aprende como a visão computacional nos cuidados de saúde está a melhorar a eficiência e vê o impacto da IA na agricultura visitando as nossas páginas de soluções! 

Logótipo do FacebookLogótipo do TwitterLogótipo do LinkedInSímbolo de ligação de cópia

Ler mais nesta categoria

Vamos construir juntos o futuro
da IA!

Começa a tua viagem com o futuro da aprendizagem automática