Descubra como a inferência em tempo real com o Ultralytics YOLO permite previsões instantâneas para aplicações de IA, como condução autónoma e sistemas de segurança.
A inferência em tempo real é o processo de utilização de um modelo de aprendizagem automática (ML) treinado para efetuar previsões em dados novos e em tempo real com um atraso mínimo. No contexto da IA e da visão por computador (CV), isto significa que o sistema pode processar informações - como um fluxo de vídeo - e gerar um resultado quase instantaneamente. O objetivo é tornar a latência da inferência suficientemente baixa para que os resultados sejam imediatamente úteis para a tomada de decisões. Esta capacidade é crucial para aplicações em que o tempo é crítico, transformando a forma como as indústrias, desde a automóvel à dos cuidados de saúde, tiram partido da IA.
É importante distinguir a inferência em tempo real da inferência em lote. A principal diferença reside na forma como os dados são processados.
Embora ambos utilizem um modelo treinado para fazer previsões, os seus casos de utilização são fundamentalmente diferentes com base na urgência dos resultados.
A capacidade de tomar decisões instantâneas permite uma vasta gama de aplicações poderosas em vários sectores.
Fazer com que os modelos funcionem suficientemente rápido para aplicações de computação em tempo real requer frequentemente uma otimização significativa:
Modelos como o Ultralytics YOLO foram concebidos tendo em mente a eficiência e a precisão, o que os torna adequados para tarefas de deteção de objectos em tempo real. Plataformas como o Ultralytics HUB fornecem ferramentas para treinar, otimizar (por exemplo, exportar para os formatos ONNX ou TensorRT) e implementar modelos, facilitando a implementação de soluções de inferência em tempo real em várias opções de implementação.