Glossário

Inferência em tempo real

Descobre como a inferência em tempo real com Ultralytics YOLO permite previsões instantâneas para aplicações de IA, como condução autónoma e sistemas de segurança.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A inferência em tempo real é o processo de fazer previsões com um modelo de aprendizagem automática assim que os novos dados ficam disponíveis. Isto contrasta com a inferência em lote, em que as previsões são feitas com base num grupo de pontos de dados recolhidos ao longo do tempo. Na inferência em tempo real, a ênfase é colocada na velocidade e no imediatismo, permitindo que os sistemas reajam e tomem decisões instantaneamente com base nas informações mais recentes.

Compreender a inferência em tempo real

No contexto da aprendizagem automática, em particular com modelos como Ultralytics YOLO , a inferência em tempo real significa que o modelo pode processar entradas de dados individuais - como imagens ou fotogramas de vídeo - e gerar previsões quase instantaneamente. Esta capacidade é crucial para aplicações em que as respostas atempadas são essenciais. Por exemplo, na deteção de objectos, a inferência em tempo real permite que um modelo identifique e localize objectos numa transmissão de vídeo em direto sem atrasos visíveis.

A eficiência da inferência em tempo real é frequentemente medida pela latência da inferência, que é o tempo que um modelo leva para produzir uma previsão a partir de uma única entrada. A baixa latência é fundamental para que os sistemas em tempo real funcionem de forma eficaz. Para obter uma latência baixa, os modelos são frequentemente optimizados em termos de velocidade através de técnicas como a quantização e a poda de modelos, ou implementados em hardware especializado como GPUs ou TPUs. Estruturas como TensorRT do NVIDIA também são projetados para acelerar a inferência, tornando o desempenho em tempo real mais viável.

Aplicações da inferência em tempo real

A inferência em tempo real é a espinha dorsal de inúmeras aplicações de ponta em vários sectores. Eis alguns exemplos concretos:

  • Condução autónoma: Os carros autónomos dependem muito da inferência em tempo real para tarefas de visão computacional. Modelos como Ultralytics YOLO são utilizados para processar feeds de câmara em tempo real para detetar peões, veículos, sinais de trânsito e outros obstáculos instantaneamente, permitindo que o veículo navegue em segurança e tome decisões de condução imediatas. Este processamento imediato não é negociável para a segurança e a capacidade de resposta dos veículos autónomos. Sabe mais sobre a IA em carros autónomos.
  • Sistemas de segurança e vigilância: Os sistemas de segurança modernos utilizam a inferência em tempo real para monitorizar as transmissões de vídeo em direto em busca de anomalias, intrusões ou actividades suspeitas. Por exemplo, um sistema pode usar Ultralytics YOLO para deteção de objetos em tempo real para identificar pessoas não autorizadas em áreas restritas ou para detetar possíveis violações de segurança no momento em que elas acontecem, disparando alertas e respostas imediatas. Explora projectos de sistemas de alarme de segurança com Ultralytics YOLOv8 .

Estes exemplos destacam o papel crítico da inferência em tempo real em aplicações que exigem uma tomada de decisão e uma resposta instantâneas com base em dados que mudam rapidamente. À medida que a tecnologia de IA avança, a inferência em tempo real continuará a permitir sistemas mais dinâmicos e reactivos, melhorando a automatização e a inteligência em todos os sectores. Para aqueles que procuram implementar a inferência em tempo real com modelos Ultralytics , plataformas como Ultralytics HUB fornecem ferramentas para treinar, otimizar e implementar modelos para um desempenho eficiente e em tempo real.

Lê tudo