Verificação verde
Link copiado para a área de transferência

Câmaras de visão computacional e suas aplicações

Desde câmaras RGB a sensores LiDAR, explora a forma como os diferentes tipos de câmaras de visão por computador são utilizados em várias aplicações em diferentes indústrias.

Muitos factores técnicos, como os dados, os algoritmos e a capacidade de computação, contribuem para o sucesso de uma aplicação de inteligência artificial (IA). Especificamente na visão computacional, um subcampo da IA que se concentra em permitir que as máquinas analisem e compreendam imagens e vídeos, um dos factores mais críticos é a entrada ou fonte de dados: a câmara. A qualidade e o tipo de câmaras utilizadas para uma aplicação de visão por computador afectam diretamente o desempenho dos modelos de IA.

A escolha da câmara certa é crucial porque diferentes tarefas de visão por computador requerem diferentes tipos de dados visuais. Por exemplo, as câmaras de alta resolução são utilizadas para aplicações como o reconhecimento facial, em que os detalhes faciais devem ser captados com precisão. Em contrapartida, as câmaras de baixa resolução podem ser utilizadas para tarefas como a monitorização de filas de espera, que dependem mais de padrões mais amplos do que de detalhes intrincados.

Atualmente, existem muitos tipos de câmaras disponíveis, cada uma concebida para satisfazer necessidades específicas. Compreender as suas diferenças pode ajudar-te a otimizar as tuas inovações de visão por computador. Vamos explorar os vários tipos de câmaras de visão por computador e as suas aplicações em diferentes indústrias.

Explorar câmaras RGB para visão computacional

As câmaras RGB (vermelho, verde e azul) são normalmente utilizadas em aplicações de visão por computador. Captam imagens no espetro visível com comprimentos de onda entre 400 e 700 nanómetros (nm). Uma vez que estas imagens são semelhantes à forma como os seres humanos vêem, as câmaras RGB são utilizadas para muitas tarefas, como a deteção de objectos, a segmentação de instâncias e a estimativa de pose em situações em que uma visão semelhante à humana é suficiente. 

Figura 1. Uma visão geral do funcionamento das câmaras RGB.

Estas tarefas envolvem normalmente a identificação e deteção de objectos a partir de uma perspetiva bidimensional (2D), em que a captura de profundidade não é necessária para obter resultados precisos. No entanto, quando uma aplicação requer informações de profundidade, como na deteção de objectos 3D ou na robótica, são utilizadas câmaras RGB-D (Vermelho, Verde, Azul e Profundidade). Estas câmaras combinam dados RGB com sensores de profundidade para captar detalhes 3D e fornecer medições de profundidade em tempo real.

Utilização de câmaras RGB-D em lojas de retalho

Uma aplicação interessante em que as câmaras RGB-D podem ser úteis é a experimentação virtual, um conceito que está a tornar-se mais popular nas lojas de retalho. Simplificando, os ecrãs inteligentes integrados com câmaras e sensores RGB-D podem recolher detalhes como a altura, a forma do corpo e a largura dos ombros de um comprador. Utilizando esta informação, o sistema pode sobrepor digitalmente o vestuário a uma imagem real do cliente. As tarefas de visão por computador, como a segmentação de instâncias e a estimativa de pose, podem processar os dados visuais para detetar com precisão o corpo do cliente e alinhar o vestuário de acordo com as suas proporções em tempo real.

Fig. 2. Um exemplo de uma prova virtual.

Os provadores virtuais dão aos clientes uma visão em 3D da forma como uma roupa lhes fica bem, e alguns sistemas podem mesmo imitar a forma como o tecido se moveria para uma experiência mais realista. A visão por computador e as câmaras RGB-D permitem que os clientes não passem pelo provador e experimentem a roupa instantaneamente. Poupa tempo, facilita a comparação de estilos e tamanhos e melhora a experiência geral de compra

Compreender a imagiologia estéreo e as câmaras Time-of-Flight (ToF)

As câmaras estéreo são um tipo de câmara que utiliza vários sensores de imagem para captar a profundidade através da comparação de imagens de diferentes ângulos. São mais precisas do que os sistemas de sensor único. Entretanto, as câmaras ou sensores de tempo de voo (ToF) medem as distâncias emitindo luz infravermelha que é reflectida nos objectos e regressa ao sensor. O tempo que a luz demora a regressar é calculado pelo processador da câmara para determinar a distância. 

Figura 3. Uma visão geral do funcionamento das câmaras ToF.

Em alguns casos, as câmaras estéreo são integradas com sensores ToF, combinando os pontos fortes de ambos os dispositivos para captar informações de profundidade rapidamente e com elevada precisão. A combinação das medições de distância em tempo real de um sensor ToF com a perceção de profundidade detalhada de uma câmara estéreo torna-a ideal para aplicações como veículos autónomos e eletrónica de consumo, onde tanto a velocidade como a precisão são vitais.

Um exemplo quotidiano de deteção de profundidade de câmaras Time-of-Flight (ToF)

É possível que já tenhas usado uma câmara de tempo de voo (ToF) sem sequer te aperceberes. De facto, os smartphones populares de marcas como a Samsung, Huawei e Realme incluem frequentemente sensores ToF para melhorar as capacidades de deteção de profundidade. A informação de profundidade precisa que estas câmaras fornecem é utilizada para criar o popular efeito bokeh, em que o fundo fica desfocado enquanto o motivo permanece focado com nitidez.

Os sensores ToF estão também a tornar-se essenciais para outras aplicações para além da fotografia, como o reconhecimento de gestos e a realidade aumentada (RA). Por exemplo, telemóveis como o Samsung Galaxy S20 Ultra e o Huawei P30 Pro utilizam estes sensores para mapear a profundidade 3D em tempo real, melhorando tanto a fotografia como as experiências interactivas.

Câmaras de infravermelhos ou térmicas para deteção de calor

As câmaras térmicas, como o nome sugere, são amplamente utilizadas para a deteção de calor em várias aplicações, incluindo indústrias transformadoras e fábricas de automóveis. Estas câmaras medem a temperatura e podem ser utilizadas para alertar os utilizadores quando detectam níveis críticos de calor demasiado elevados ou demasiado baixos. Ao detetar a radiação infravermelha, que é invisível ao olho humano, fornece leituras precisas da temperatura. Frequentemente designadas por câmaras de infravermelhos, as suas utilizações também vão para além dos ambientes industriais. Por exemplo, as câmaras térmicas também são utilizadas na agricultura para monitorizar a saúde do gado, em inspecções de edifícios para identificar fugas de calor e no combate a incêndios para localizar focos de incêndio.

Fig. 4. Bombeiros usam câmaras térmicas para encontrar pontos quentes.

Imagem térmica para aplicações industriais

Máquinas e sistemas eléctricos em fábricas ou plataformas de petróleo e gás funcionam frequentemente de forma contínua e geram calor como subproduto. Com o passar do tempo, pode ocorrer uma acumulação excessiva de calor em componentes como motores, rolamentos ou circuitos eléctricos, levando potencialmente à falha do equipamento ou a riscos de segurança

As câmaras térmicas podem ajudar os operadores a monitorizar estes sistemas, detectando precocemente picos de temperatura anormais. Um motor sobreaquecido pode ser programado para manutenção e para evitar avarias dispendiosas. Ao integrar a imagem térmica em inspecções regulares, as indústrias podem implementar a manutenção preditiva, reduzir o tempo de inatividade, prolongar a vida útil do equipamento e garantir um ambiente de trabalho mais seguro. No geral, o desempenho da fábrica pode ser melhorado e o risco de falhas inesperadas pode ser minimizado.

Câmaras lentas e de alta velocidade para captura de movimento

As câmaras de alta velocidade são concebidas para captar mais de 10.000 fotogramas por segundo (FPS), de modo a poderem processar movimentos rápidos com uma precisão excecional. Por exemplo, quando os produtos se movem rapidamente numa linha de produção, as câmaras de alta velocidade podem ser utilizadas para os monitorizar e detetar quaisquer anomalias.

Por outro lado, as câmaras de câmara lenta podem ser utilizadas para captar imagens com taxas de fotogramas elevadas e depois reduzir a velocidade de reprodução. Isto permite que os espectadores observem detalhes que muitas vezes passam despercebidos em tempo real. Estas câmaras são utilizadas para avaliar o desempenho de armas de fogo e materiais explosivos. A capacidade de abrandar e analisar movimentos complexos é ideal para este tipo de aplicação.

Em determinadas situações, a combinação de câmaras de alta velocidade e de câmara lenta pode ajudar na análise detalhada de objectos em movimento rápido e lento dentro do mesmo evento. Digamos que estamos a analisar um jogo de golfe. As câmaras de alta velocidade podem medir a velocidade de uma bola de golfe, enquanto as câmaras de câmara lenta podem analisar os movimentos de tacada e o controlo corporal de um jogador de golfe.

Fig. 5. Utiliza a visão por computador e câmaras de alta velocidade para analisar o swing de um jogador de golfe. 

Imagem multiespectral em visão computacional

As câmaras multiespectrais são dispositivos especializados que podem registar vários comprimentos de onda do espetro de luz, incluindo ultravioleta e infravermelho, num único disparo. A imagem multiespectral fornece dados detalhados valiosos que as câmaras tradicionais não conseguem captar. Semelhante às câmaras hiperespectrais, que captam bandas de luz ainda mais estreitas e contínuas, as câmaras multiespectrais são utilizadas em áreas como a agricultura, a geologia, a monitorização ambiental e a imagiologia médica. Por exemplo, nos cuidados de saúde, as câmaras multiespectrais podem ajudar a visualizar diferentes tecidos através da captura de imagens em vários comprimentos de onda.

Fig. 6. Comparação de imagens RGB, multiespectrais e hiperespectrais.

Do mesmo modo, os drones equipados com imagens multiespectrais estão a dar passos significativos na agricultura. Podem identificar plantas pouco saudáveis ou afectadas por insectos e pragas numa fase inicial. Estas câmaras podem analisar o espetro de infravermelhos próximos, e as plantas saudáveis reflectem geralmente mais luz de infravermelhos próximos do que as que não estão saudáveis. Ao adotar estas técnicas de IA na agricultura, os agricultores podem implementar contramedidas precocemente para aumentar o rendimento e reduzir a perda de colheitas.

Câmaras LiDAR para veículos autónomos

As câmaras LiDAR (Light Detection and Ranging) utilizam impulsos laser para criar mapas 3D e detetar objectos à distância. São eficazes em muitas condições, como nevoeiro, chuva, escuridão e temperaturas elevadas, embora o mau tempo, como a chuva ou o nevoeiro, possa afetar o seu desempenho. O LiDAR é normalmente utilizado em aplicações como carros autónomos para navegação e deteção de obstáculos. 

O LiDAR actua como os olhos do automóvel, enviando impulsos de laser e medindo o tempo que demoram a ser reflectidos. Estas informações ajudam o automóvel a calcular distâncias e a identificar objectos como carros, peões e sinais de trânsito, proporcionando uma visão de 360 graus para uma condução mais segura.

Coloca tudo em foco

No que diz respeito à visão por computador, as câmaras funcionam como os olhos que permitem às máquinas ver e interpretar o mundo de forma semelhante à dos humanos. A escolha do tipo certo de câmara é fundamental para o sucesso de diferentes aplicações de visão por computador. Desde câmaras RGB padrão a sistemas LiDAR avançados, cada tipo oferece caraterísticas únicas adequadas a tarefas específicas. Ao compreender a variedade de tecnologias de câmaras e as suas utilizações, os programadores e investigadores podem otimizar melhor os modelos de visão por computador para enfrentar desafios complexos do mundo real.

Explora mais sobre a IA consultando o nosso repositório GitHub. Junta-te à nossa comunidade para te ligares a outros entusiastas da IA de visão que pensam da mesma forma. Sabe mais sobre aplicações de visão computacional nos cuidados de saúde e fabrico nas nossas páginas de soluções.

Logótipo do FacebookLogótipo do TwitterLogótipo do LinkedInSímbolo de ligação de cópia

Ler mais nesta categoria

Vamos construir juntos o futuro
da IA!

Começa a tua viagem com o futuro da aprendizagem automática