Vê porque é que o FPS na visão por computador é importante e como afecta a deteção de objectos em tempo real, a análise de vídeo e as aplicações baseadas em IA.
Ver uma repetição em câmara lenta do teu momento desportivo favorito, em que todos os detalhes são nítidos, é muito diferente de ver uma filmagem de vigilância que, normalmente, parece irregular e difícil de seguir. O principal detalhe técnico por trás dessas diferenças é o FPS, ou quadros por segundo, que se refere ao número de quadros exibidos por segundo em um vídeo. Um FPS mais alto resulta em movimentos suaves e realistas, enquanto um FPS mais baixo pode resultar em filmagens irregulares e menos detalhadas.
Este conceito tem um impacto direto na visão por computador, um ramo da IA que permite às máquinas interpretar e analisar dados visuais de forma semelhante à dos humanos. Na visão por computador, um FPS mais elevado significa que os sistemas podem captar mais informações por segundo, melhorando a precisão da deteção e seguimento de objectos em tempo real.
Neste artigo, vamos explorar os aspectos técnicos do FPS e a sua relação com as aplicações de visão por computador. Começa a trabalhar!
Digamos que estás a jogar um jogo de corridas: a 60 FPS, cada curva é suave e reactiva, mas a 20 FPS, os controlos ficam atrasados, tornando mais difícil desviar dos obstáculos. Em termos simples, podes pensar em FPS como o número de imagens fixas que são mostradas por segundo. Mais imagens por segundo fazem com que o movimento pareça suave e natural, enquanto menos imagens podem fazer com que pareça instável.
Tal como nos jogos, o FPS é uma parte fundamental das aplicações de visão por computador. Um FPS mais elevado torna possível seguir objectos utilizando a IA de visão sem problemas, enquanto um FPS mais baixo pode resultar na perda de detalhes.
Por exemplo, na análise desportiva, as câmaras alimentadas por IA necessitam de um FPS mais elevado para poderem seguir passes rápidos, movimentos dos jogadores e trajectórias da bola. Um FPS mais baixo pode fazer com que se perca um contacto importante pé-bola ou uma mudança rápida de direção, afectando a precisão da análise.
Da mesma forma, no monitoramento de tráfego, os sistemas dependem de alto FPS para detetar veículos em excesso de velocidade e mudanças de faixa em tempo real. A escolha do FPS correto depende dos requisitos específicos de cada aplicação de visão por computador, equilibrando desempenho, eficiência e clareza visual.
Agora que já falámos sobre o que é o FPS e como é utilizado na visão por computador, vamos mergulhar nos seus aspectos técnicos - começando por como calcular o FPS de um vídeo.
Dividindo o número total de fotogramas pela duração em segundos, obténs o FPS de um vídeo. Por exemplo, se um vídeo tiver 96 fotogramas em 4 segundos, calcula 24 FPS - o que significa que são apresentadas 24 imagens por segundo - enquanto que 32 fotogramas em 4 segundos resultam em 8 FPS. As bibliotecas Python , como o OpenCV, podem ser utilizadas para extrair metadados de vídeo, contar fotogramas e calcular automaticamente o FPS, simplificando o processo de análise de vídeo.
No entanto, calcular o FPS por si só não é suficiente para tomar decisões técnicas ao desenvolver soluções de visão computacional. Também é importante considerar os vários fatores que podem afetar a taxa de quadros efetiva, como recursos de hardware, otimizações de software e condições ambientais.
Vê mais de perto esses factores:
Modelos de IA como Ultralytics YOLO11 que suportam tarefas de visão computacional em tempo real, podem ser utilizados para analisar vídeos com elevadas taxas de fotogramas. Esta capacidade em tempo real é crítica para aplicações como a condução autónoma, a vigilância e a robótica, onde mesmo pequenos atrasos podem levar a erros significativos.
Vamos analisar algumas aplicações de IA de visão do mundo real em que um FPS elevado é essencial para a precisão e o desempenho.
Os sistemas de vigilância que monitorizam áreas de elevado tráfego, como as auto-estradas, utilizam um FPS elevado para captar detalhes minuciosos, garantindo que os veículos em movimento rápido são claramente documentados. Esta clareza é essencial para os sistemas de reconhecimento automático de matrículas (ANPR), que dependem de filmagens de boa qualidade para identificar os veículos com exatidão.
Nesses sistemas, modelos como o YOLO11 podem ser utilizados para detetar matrículas diretamente a partir da transmissão de vídeo. Assim que uma matrícula é detectada, o reconhecimento ótico de caracteres (OCR), que converte imagens de texto em caracteres legíveis por máquina, é utilizado para ler os detalhes da matrícula. Este processo permite uma identificação rápida e exacta do veículo, melhorando a fiscalização do trânsito e a segurança geral.
Considera um carro autónomo num sinal de stop, analisando cuidadosamente o que o rodeia para decidir se pode avançar em segurança. Este carro tem de tomar decisões quase instantâneas, o que exige a captura e o processamento de dados visuais em tempo real.
Se o veículo autónomo estiver equipado com câmaras que possam captar imagens a um FPS mais elevado, recebe um fluxo de imagens mais contínuo e detalhado. Esta entrada visual melhorada permite que o carro detecte rapidamente obstáculos, peões e outros veículos. Torna possível que o veículo reaja prontamente a quaisquer alterações no seu ambiente.
Se as câmaras estivessem a processar imagens a um FPS inferior, o veículo poderia receber uma imagem mais fragmentada e menos detalhada. Isto poderia atrasar o seu tempo de resposta, aumentando o risco de perder informação crítica e potencialmente comprometendo a segurança.
Capturar cada movimento com precisão é crucial no desporto, onde decisões em fracções de segundo podem fazer toda a diferença entre ganhar e perder. A tecnologia que suporta um FPS mais elevado permite-nos registar todos os pequenos detalhes em movimento, e os treinadores, analistas e atletas podem rever as jogadas em câmara lenta sem perder o ritmo. Também ajuda os árbitros a tomar decisões mais precisas em desportos como o ténis, o futebol e o críquete, fornecendo uma visão clara da ação, fotograma a fotograma.
Por exemplo, um estudo interessante sobre voleibol analisou a forma como a utilização de um FPS mais elevado melhora a avaliação do desempenho. Aumentar o FPS de 30 para 240 melhorou significativamente a nitidez do movimento e o seguimento de objectos. A precisão da análise de picos também melhorou, ajudando os treinadores a compreender com mais precisão o posicionamento das mãos, os pontos de contacto com a bola e a mecânica do salto. Para além disso, o estudo concluiu que um FPS mais elevado reduziu a desfocagem do movimento, facilitando a análise dos serviços e das reacções defensivas.
Nem todas as aplicações de visão por computador requerem a gravação de imagens a um FPS mais elevado. Em muitos casos, um FPS mais baixo é suficiente para obter resultados precisos, dependendo da tarefa. Aqui estão algumas áreas-chave onde um FPS mais baixo é preferível:
Para selecionar o FPS ideal, é necessário equilibrar o desempenho com as limitações do sistema. Aqui estão algumas considerações a ter em conta ao otimizar o FPS para aplicações de aprendizagem profunda:
Os avanços na IA e na otimização de hardware estão a tornar mais viáveis taxas de fotogramas mais elevadas, mesmo em ambientes com recursos limitados. Por exemplo, indústrias como o cinema, o desporto e a robótica podem beneficiar de uma gestão mais inteligente da velocidade de fotogramas, em que os sistemas ajustam dinamicamente o FPS com base na complexidade do movimento e na capacidade de processamento. A interpolação de fotogramas orientada por IA também melhora a suavidade do vídeo ao gerar fotogramas adicionais em tempo real.
Entretanto, uma recente descoberta da NVIDIA está a levar o desempenho FPS ainda mais longe. O DLSS 4 (Deep Learning Super Sampling) introduz a geração de vários fotogramas, que utiliza IA para prever e criar fotogramas extra. Isto aumenta as taxas de fotogramas até 8 vezes, reduzindo a carga de trabalho do sistema.
Ao deixar a IA tratar de parte da renderização, o DLSS 4 torna os visuais mais suaves sem sobrecarregar o hardware, melhorando o desempenho e a eficiência.
O FPS é mais do que apenas uma medida de suavidade visual; ele impulsiona a tomada de decisões em tempo real na IA e na visão computacional. Cada quadro de um vídeo captura dados críticos, permitindo que as máquinas rastreiem objetos, analisem movimentos e respondam a ambientes dinâmicos. Quer se trate de carros autónomos que evitam obstáculos ou de sistemas de vigilância que detectam ameaças instantaneamente, o FPS correto garante precisão e eficiência.
O futuro do FPS não é apenas aumentar as taxas de quadros, mas também otimizá-las de forma inteligente. Esta evolução tornará os sistemas de visão por computador mais rápidos, mais inovadores e mais eficientes em termos de recursos em várias indústrias.
Queres saber mais sobre IA? Explora o nosso repositório GitHub e junta-te à nossa comunidade. Estás pronto para iniciar os teus próprios projectos de visão computacional? Verifica as nossas opções de licenciamento. Aprende como a visão computacional nos cuidados de saúde está a melhorar a eficiência e explora o impacto da IA no fabrico visitando as nossas páginas de soluções!
Começa a tua viagem com o futuro da aprendizagem automática