Contrôle vert
Lien copié dans le presse-papiers

Explorer comment la vision par ordinateur peut être utilisée pour la détection du regard.

Découvre comment les techniques de Vision AI telles que la détection d'objets et l'estimation de la pose peuvent être utilisées pour le suivi des yeux et la détection du regard dans diverses applications.

La vision par ordinateur est une branche de l'intelligence artificielle (IA) qui vise à permettre aux machines d'analyser et d'interpréter les données visuelles d'une manière similaire à celle des humains. Une application particulièrement fascinante de la vision artificielle est la détection du regard, qui permet aux machines de suivre et de comprendre où une personne regarde.

En tant qu'humains, nous pouvons naturellement suivre le regard de quelqu'un et comprendre ce sur quoi il se concentre. Par exemple, si tu parles à un ami et qu'il regarde soudain vers la porte, tu te tourneras instinctivement pour voir ce qui a attiré son attention. Les machines, en revanche, n'ont pas cette capacité intégrée - elles doivent être formées à l'aide de techniques de vision par ordinateur pour reconnaître les mouvements des yeux et interpréter la direction du regard. 

Alors que le marché mondial de la détection du regard devrait atteindre 11,9 milliards de dollars d'ici 2032, de nombreuses industries l'adoptent pour différentes applications. Par exemple, la détection du regard dans les voitures est utilisée pour améliorer la sécurité des conducteurs en surveillant les niveaux d'attention et en détectant les signes de somnolence ou de distraction.

Dans cet article, nous allons explorer comment la vision par ordinateur est utilisée pour le suivi des yeux et la détection du regard. Nous examinerons également certaines de ses principales applications dans divers secteurs d'activité. Commençons !

Qu'est-ce que l'oculométrie et la détection du regard ?

Le suivi des yeux et la détection du regard sont des techniques utilisées pour déterminer le centre d'attention d'une personne en analysant les mouvements des yeux et la direction du regard. Grâce aux progrès de l'IA et de la technologie des capteurs, il est désormais possible de suivre les yeux d'une personne en temps réel. 

Traditionnellement, la plupart des systèmes de suivi oculaire reposent sur des caméras infrarouges (IR), qui détectent les mouvements de la pupille en éclairant les yeux avec une lumière proche de l'infrarouge et en capturant les reflets de la cornée. Ces systèmes offrent une grande précision. Cependant, ils nécessitent souvent un casque spécialisé, qui peut être inconfortable à porter et sujet à des problèmes d'étalonnage.

Avec l'essor de l'IA, les chercheurs ont activement exploré les méthodes de suivi oculaire basées sur la vision par ordinateur. Contrairement aux systèmes traditionnels basés sur l'infrarouge, ces approches s'appuient sur des modèles de vision par ordinateur tels que Ultralytics YOLO11 pour détecter les caractéristiques faciales telles que les yeux et les pupilles, ainsi que pour effectuer l'estimation de la pose de la tête. Au-delà, des modèles d'apprentissage profond spécialisés comme GazeNet de NVIDIA sont conçus spécifiquement pour l'estimation du regard. 

Fig 1. Exemple d'utilisation de YOLO11 pour détecter les yeux et la pupille d'une personne.

Bien qu'il s'agisse encore d'un domaine en évolution, le suivi du regard basé sur la vision par ordinateur a le potentiel de rendre le suivi des yeux plus accessible, de réduire les coûts et d'améliorer la facilité d'utilisation pour les applications en marketing, en psychologie et en neurosciences.

L'évolution de la détection du regard et de l'oculométrie

Ensuite, explorons le passage des systèmes traditionnels basés sur l'infrarouge à des solutions plus accessibles, basées sur des logiciels.

Tu te demandes peut-être si l'oculométrie et la détection du regard peuvent se faire sans IA - alors pourquoi y a-t-il des recherches en cours sur l'intégration de l'IA et de la vision par ordinateur dans ces technologies ? S'il existe des méthodes traditionnelles de suivi du regard, elles reposent souvent sur des caméras infrarouges spécialisées et des dispositifs de suivi du regard montés sur la tête, qui peuvent être coûteux, encombrants et nécessiter des conditions d'éclairage contrôlées. Les solutions basées sur l'IA, cependant, permettent le suivi oculaire en utilisant des webcams standard et des caméras de smartphones, ce qui réduit les coûts et améliore l'accessibilité. 

Fig 2. Un dispositif de suivi des yeux monté sur la tête.

Voici quelques-uns des autres facteurs à l'origine de l'évolution de la technologie de suivi des yeux et de détection du regard :

  • Applications: Les approches basées sur les logiciels permettent à cet espace de s'étendre au-delà de la recherche vers les appareils grand public et des domaines tels que les jeux.
  • Évolutivité: L'IA peut intervenir pour mettre les solutions de détection du regard à la disposition d'un public plus large, des utilisateurs individuels aux industries à grande échelle.
  • Les progrès de la technologie des appareils photo: Aujourd'hui, nous avons accès à des caméras de smartphones et de webcams à plus haute résolution qui améliorent la précision du suivi oculaire - ce qui n'était pas faisable il y a 20 ans.

Utilisation de Ultralytics YOLO11 pour la détection et le suivi du regard

Maintenant que nous avons discuté du rôle de la vision par ordinateur dans le suivi des yeux et la détection du regard, voyons comment YOLO11 peut être utilisé ici.

Ultralytics YOLO11 prend en charge des tâches telles que la détection d'objets et l'estimation de la pose. Pré-entraîné sur l'ensemble de données COCO, il atteint une grande précision dans la détection de divers objets. Plus précisément, pour une solution de détection du regard, YOLO11 peut jouer un rôle de soutien. 

Bien qu'il ne puisse pas prédire directement la direction du regard, il peut être affiné pour détecter les visages, les yeux et les pupilles, qui sont essentiels pour une analyse plus approfondie. Une fois ces caractéristiques identifiées, des modèles supplémentaires peuvent traiter les données relatives aux mouvements oculaires pour estimer la direction du regard. 

Par exemple, pour améliorer la précision, YOLO11 peut être entraîné sur mesure sur des ensembles de données tels que WIDER FACE pour la détection des visages. De plus, en ce qui concerne les capacités d'estimation de la pose de YOLO11, il peut aider à suivre l'orientation de la tête, ce qui améliore la précision de la détection du regard.

Fig 3. YOLO11 peut être utilisé pour détecter les visages humains.

Applications de la détection du regard dans le monde réel

La détection du regard, rendue possible par la vision par ordinateur, a un large éventail d'applications dans tous les secteurs, de l'amélioration de la sécurité dans le secteur automobile à l'analyse de la concentration dans les jeux. Explorons comment différents domaines tirent parti de cette technologie.

Suivi du regard dans les jeux

L'oculométrie est utilisée dans les jeux pour fournir des informations en temps réel sur la concentration, la prise de décision et les temps de réaction des joueurs. En suivant les mouvements des yeux, cette technologie aide les joueurs à affiner leurs stratégies, améliore les programmes d'entraînement et l'engagement du public en affichant visuellement l'endroit où les joueurs regardent pendant les moments clés.

Un exemple intéressant est celui de la simulation de course, un sport automobile virtuel compétitif où les joueurs font la course en utilisant des simulations de conduite réalistes. Le suivi oculaire permet d'analyser la façon dont les conducteurs se concentrent sur la piste, réagissent aux adversaires et négocient les virages serrés. En suivant leur regard en temps réel, les formateurs peuvent identifier des modèles, repérer les distractions et améliorer les stratégies de course. 

Fig 4. Le suivi oculaire peut être utilisé pour surveiller et analyser les coureurs de simulations. 

Au-delà des courses de simulation, l'oculométrie est également utilisée dans les jeux de compétition rapides pour analyser les réflexes des joueurs, leurs temps de réaction et la façon dont ils se concentrent sur les éléments clés du jeu. En comprenant où un joueur regarde avant de faire un mouvement, ces données permettent d'affiner la prise de décision, d'améliorer la précision et de renforcer l'entraînement pour le jeu de haut niveau.

Estimation du regard pour la recherche psychologique

Il existe de nombreuses applications Vision AI de l'estimation du regard liées à la recherche. Un bon exemple est son utilisation en psychologie pour étudier l'attention, la charge cognitive et le comportement social. En analysant les mouvements oculaires, les chercheurs peuvent obtenir des informations sur la perception, la prise de décision et les troubles mentaux tels que l'autisme et le TDAH. 

Plus précisément, le suivi du regard à l'aide de la vision par ordinateur permet d'identifier des schémas dans les mouvements oculaires, la durée de fixation et l'attention visuelle, qui peuvent révéler des états cognitifs et émotionnels. Grâce aux progrès de l'apprentissage profond et de l'estimation du regard pilotée par l'IA, ces méthodes deviennent plus précises et plus accessibles, ce qui permet d'élargir les applications dans le domaine de la recherche neurologique.

Sécurité automobile

Au fil des ans, les chercheurs ont utilisé différentes méthodes pour étudier l'attention et la concentration des conducteurs dans différentes conditions de circulation. Parmi ces méthodes, l'eye-tracking s'est avéré crucial et peut donner des indications sur l'endroit où le conducteur regarde pendant qu'il conduit. 

À l'aide de modèles de vision par ordinateur, la détection du regard peut encore améliorer cette analyse en suivant avec précision les mouvements des yeux en temps réel. Cette analyse peut nous permettre de mieux comprendre le comportement du conducteur, en l'aidant à identifier les distractions, la fatigue ou les manques d'attention, ce qui peut améliorer la sécurité routière et aider à développer des systèmes avancés d'aide à la conduite.

Fig 5. Exemple de surveillance d'un conducteur à l'aide de la détection des visages et du suivi du regard.

Par exemple, si un conducteur détourne fréquemment le regard de la route pour consulter son téléphone ou est lent à réagir aux intersections, le système peut détecter ces comportements et émettre des alertes pour recentrer son attention, ce qui peut prévenir les accidents.

Avantages et inconvénients de l'oculométrie et de la détection du regard

Voici quelques-uns des principaux avantages que les technologies d'eye-tracking et de détection du regard peuvent apporter à notre vie quotidienne :

  • Une meilleure prise de conscience : L'oculométrie permet de comprendre comment les gens interagissent visuellement avec leur environnement, ce qui aide à mieux comprendre les modèles d'attention et de concentration.
  • Une meilleure prise de décision: Les données recueillies grâce à l'oculométrie aident les chercheurs et les professionnels à prendre des décisions éclairées basées sur des modèles d'attention objectifs.
  • Amélioration de l'ergonomie visuelle: L'analyse du comportement du regard peut aider à concevoir des écrans, des espaces de travail et des environnements qui réduisent la fatigue oculaire et améliorent le confort.

Bien que ces avantages mettent en évidence la façon dont la détection du regard peut avoir un impact positif sur nos vies, il est également important de prendre en compte les défis liés à sa mise en œuvre. Voici quelques-unes des principales limites à garder à l'esprit :

  • Questions relatives à la protection de la vie privée: Le suivi oculaire continu peut soulever des problèmes de confidentialité, mettant les utilisateurs mal à l'aise. Garantir la transparence, le consentement de l'utilisateur et le traitement local des données peut contribuer à atténuer ces préoccupations.
  • Demande de calcul élevée : Le suivi du regard en temps réel peut nécessiter un matériel puissant, ce qui limite l'accessibilité sur les appareils à faible puissance. Cependant, des modèles optimisés permettent d'améliorer l'efficacité.
  • Limites de précision : Le suivi du regard peut être moins fiable dans le monde réel en raison des changements d'éclairage, des mouvements de la tête ou des obstacles comme les lunettes et les cheveux. Les angles de la caméra peuvent également affecter les performances.

Garde les yeux sur l'avenir

L'oculométrie et la détection du regard, soutenues par des modèles de vision par ordinateur comme YOLO11, changent la façon dont nous interagissons avec le monde. Qu'il s'agisse de rendre les routes plus sûres ou de comprendre le comportement humain, cette technologie devient de plus en plus utile dans la vie de tous les jours.

Bien qu'il y ait des défis à relever, comme le respect de la vie privée et la nécessité de disposer d'ordinateurs puissants, les progrès de l'IA et de la vision par ordinateur rendent l'oculométrie plus précise et plus facile à utiliser. À mesure qu'il continue de s'améliorer, il jouera probablement un rôle plus important dans toute une série d'industries.

Pour en savoir plus, visite notre dépôt GitHub et engage-toi auprès de notre communauté. Explore les innovations dans des secteurs comme l'IA dans les voitures auto-conduites et la vision par ordinateur dans l'agriculture sur nos pages de solutions. Découvre nos options de licence et donne vie à tes projets de vision artificielle. 🚀

Logo FacebookLogo de TwitterLogo LinkedInSymbole du lien de copie

Lire la suite dans cette catégorie

Construisons ensemble le futur
de l'IA !

Commence ton voyage avec le futur de l'apprentissage automatique.