Glossaire

Inférence en temps réel

Découvre comment l'inférence en temps réel avec Ultralytics YOLO permet des prédictions instantanées pour les applications d'IA comme la conduite autonome et les systèmes de sécurité.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

L'inférence en temps réel consiste à faire des prédictions avec un modèle d'apprentissage automatique dès que de nouvelles données sont disponibles. Cela contraste avec l'inférence par lots, où les prédictions sont faites sur un groupe de points de données collectés au fil du temps. Dans l'inférence en temps réel, l'accent est mis sur la vitesse et l'immédiateté, ce qui permet aux systèmes de réagir et de prendre des décisions instantanément en fonction des dernières informations.

Comprendre l'inférence en temps réel

Dans le contexte de l'apprentissage automatique, en particulier avec des modèles tels que Ultralytics YOLO , l'inférence en temps réel signifie que le modèle peut traiter des entrées de données individuelles - telles que des images ou des trames vidéo - et générer des prédictions presque instantanément. Cette capacité est cruciale pour les applications où des réponses rapides sont essentielles. Par exemple, dans la détection d'objets, l'inférence en temps réel permet à un modèle d'identifier et de localiser des objets dans un flux vidéo en direct sans délai notable.

L'efficacité de l'inférence en temps réel est souvent mesurée par la latence de l'inférence, qui est le temps nécessaire à un modèle pour produire une prédiction à partir d'une seule entrée. Une faible latence est essentielle pour que les systèmes en temps réel fonctionnent efficacement. Pour obtenir une faible latence, les modèles sont souvent optimisés pour la vitesse grâce à des techniques telles que la quantification et l'élagage des modèles, ou déployés sur du matériel spécialisé comme les GPU ou les TPU. Des structures telles que TensorRT de NVIDIA sont également conçus pour accélérer l'inférence, ce qui rend les performances en temps réel plus accessibles.

Applications de l'inférence en temps réel

L'inférence en temps réel est l'épine dorsale de nombreuses applications de pointe dans divers secteurs. Voici quelques exemples concrets :

  • Conduite autonome: Les voitures autonomes s'appuient fortement sur l'inférence en temps réel pour les tâches de vision par ordinateur. Des modèles tels que Ultralytics YOLO sont utilisés pour traiter les flux de caméra en temps réel afin de détecter instantanément les piétons, les véhicules, les panneaux de signalisation et autres obstacles, ce qui permet au véhicule de naviguer en toute sécurité et de prendre des décisions de conduite immédiates. Ce traitement immédiat est non négociable pour la sécurité et la réactivité des véhicules autonomes. En savoir plus sur l'IA dans les voitures autonomes.
  • Systèmes de sécurité et de surveillance: Les systèmes de sécurité modernes utilisent l'inférence en temps réel pour surveiller les flux vidéo en direct à la recherche d'anomalies, d'intrusions ou d'activités suspectes. Par exemple, un système peut utiliser Ultralytics YOLO pour la détection d'objets en temps réel afin d'identifier les personnes non autorisées dans les zones restreintes ou de détecter les failles de sécurité potentielles au moment où elles se produisent, ce qui déclenche des alertes et des réponses immédiates. Explore les projets de systèmes d'alarme de sécurité avec Ultralytics YOLOv8 .

Ces exemples soulignent le rôle essentiel de l'inférence en temps réel dans les applications qui exigent une prise de décision et une réponse instantanées basées sur des données qui évoluent rapidement. À mesure que la technologie de l'IA progresse, l'inférence en temps réel continuera à permettre des systèmes plus dynamiques et réactifs, améliorant l'automatisation et l'intelligence dans tous les secteurs d'activité. Pour ceux qui cherchent à mettre en œuvre l'inférence en temps réel avec des modèles Ultralytics , des plateformes comme Ultralytics HUB fournissent des outils pour former, optimiser et déployer des modèles pour une performance efficace et en temps réel.

Tout lire