Découvre la puissance de l'Optical Flow dans la vision par ordinateur. Apprends comment il estime le mouvement, améliore l'analyse vidéo et favorise les innovations en matière d'IA.
Le flux optique est un concept fondamental de la vision par ordinateur (cv ) utilisé pour décrire le mouvement apparent des objets, des surfaces et des bords dans une scène visuelle, causé par le mouvement relatif entre un observateur (comme une caméra) et la scène. Il calcule un champ de vecteurs représentant le déplacement des motifs de luminosité (pixels ou caractéristiques) entre les images consécutives d'une séquence vidéo. Cela fournit des informations précieuses sur la dynamique des mouvements au sein de la vidéo, qui constituent la base de nombreuses tâches de vision de haut niveau.
Le flux optique a de nombreuses applications pratiques dans différents domaines :
Bien qu'ils soient liés, le flux optique et le suivi d'objet sont des tâches distinctes. Le flux optique fournit des vecteurs de mouvement de bas niveau pour les pixels ou les caractéristiques entre deux images consécutives. Il ne comprend pas intrinsèquement l'identité des objets ou ne les suit pas sur de longues durées.
Le suivi d'objets, souvent effectué à l'aide de modèles tels que Ultralytics YOLOse concentre sur l'identification d'instances d'objets spécifiques (généralement détectées par le biais de la détection d'objets) et sur le maintien de leurs identités et de leurs trajectoires sur plusieurs images, potentiellement sur de longues périodes. Les algorithmes de suivi utilisent fréquemment le flux optique comme entrée (avec des modèles d'apparence, des filtres de Kalman, etc.) pour prédire l'emplacement des objets dans les images suivantes, mais le suivi est une tâche de plus haut niveau qui concerne la persistance des objets. Tu peux explorer des modèles comme YOLOv8 pour le suivi.
Des bibliothèques comme OpenCV fournissent des implémentations facilement disponibles de divers algorithmes de flux optique.
Comment fonctionne le flux optique
L'hypothèse de base qui sous-tend la plupart des algorithmes de flux optique est la constance de la luminosité - l'idée que l'intensité d'un point spécifique sur un objet reste constante sur de courts intervalles de temps, même lorsqu'il se déplace sur le plan de l'image. Les algorithmes suivent ces modèles de luminosité constante d'une image à l'autre pour estimer les vecteurs de mouvement. Les techniques courantes comprennent :
Ces méthodes fournissent une compréhension de bas niveau du mouvement des pixels, qui peut ensuite être interprétée pour diverses applications.