Contrôle vert
Lien copié dans le presse-papiers

Comment calculer la distance à l'aide de modèles de vision par ordinateur ?

Apprends comment le calcul de la distance dans les applications de vision par ordinateur à l'aide d'Ultralytics YOLO11 permet de mesurer la proximité des objets en temps réel.

Lorsque tu traverses la route et que tu vois une voiture venir vers toi, tu peux instantanément dire approximativement à quelle distance elle se trouve. Ce jugement rapide, presque instinctif, est dû à une compréhension spatiale de ton environnement. En te basant sur ce sens, tu peux décider d'accélérer, de t'arrêter ou de continuer à marcher. 

De même, la vision par ordinateur est une branche de l'intelligence artificielle (IA) qui permet aux machines de développer une compréhension de leur environnement en interprétant les données visuelles. Tout comme tu peux évaluer la proximité d'une voiture pour prendre des décisions rapides, les modèles de vision par ordinateur peuvent analyser les images et les vidéos, aidant ainsi les machines à sentir et à réagir au monde qui les entoure.

Par exemple , Ultralytics YOLO11 est un modèle de vision par ordinateur qui permet de détecter et de suivre des objets dans des images et des vidéos en temps réel. En termes simples, YOLO11 fonctionne en regardant toute l'image à la fois, plutôt que par parties, ce qui le rend plus rapide et plus efficace. Il peut également gérer des tâches de vision par ordinateur telles que la segmentation d'instances, l'estimation de la pose et la classification d'images.

Les capacités de YOLO11 peuvent notamment être utilisées pour calculer la distance qui sépare les objets les uns des autres, ce qui est utile dans de nombreux domaines tels que la fabrication, la vente au détail et la gestion des foules, contribuant ainsi à améliorer la sécurité et l'efficacité.

Dans cet article, nous allons explorer comment YOLO11 peut être utilisé pour le calcul de la distance dans les applications de vision par ordinateur, pourquoi il est important, et son impact à travers différentes industries.

Fig 1. Exemple d'utilisation de YOLO pour calculer la distance d'atterrissage d'un avion.

Un aperçu du calcul de la distance dans la vision par ordinateur

Le calcul de la distance en vision par ordinateur consiste à détecter, localiser et mesurer les pixels entre deux objets dans une image. Les pixels sont les unités individuelles qui composent une image numérique, chacune représentant un point unique avec une couleur ou une valeur d'intensité spécifique. 

Pour convertir les mesures des pixels en distances réelles, l'étalonnage est essentiel. C'est comme si tu utilisais une règle pour mesurer quelque chose et que tu te servais de cette mesure pour comprendre la taille d'autres objets. En se référant à des objets dont la taille est connue, l'étalonnage crée un lien entre les pixels et les distances physiques réelles.

Prenons un exemple pour voir comment cela fonctionne. Dans l'image ci-dessous, la pièce de monnaie est l'objet de référence, et sa taille (0,9 pouce par 1 pouce) est connue. En comparant les mesures en pixels des autres objets à la taille de la pièce, nous pouvons calculer leur taille réelle.

Fig 2. Une pièce de monnaie peut être utilisée comme référence pour mesurer la taille réelle d'autres objets.

Cependant, le calcul de la distance se fait dans un plan bidimensionnel (2D), ce qui signifie qu'il ne mesure que les distances horizontales et verticales entre les objets. Cela diffère de l'estimation de la profondeur, qui mesure la distance des objets dans un espace tridimensionnel, y compris leur distance par rapport à la caméra.

Bien que les caméras de profondeur puissent mesurer la profondeur réelle et donner des informations spatiales plus détaillées, dans de nombreux cas, une simple distance calibrée suffit. Par exemple, le fait de savoir à quelle distance se trouvent les objets sur un plan 2D fonctionne bien pour des tâches telles que le suivi d'objets ou la gestion de files d'attente, l'estimation de la profondeur n'est donc pas nécessaire dans ces situations.

Comprendre comment fonctionne le calcul de la distance à l'aide de YOLO11

Ensuite, voyons comment calculer la distance entre deux objets en utilisant le support de YOLO11pour la détection et le suivi d'objets. En voici un aperçu :

  • Détection et suivi d'objets: YOLO11 peut être utilisé pour détecter des objets en les reconnaissant dans une image et en suivant leur mouvement à travers les images d'une vidéo. Il attribue un identifiant de suivi unique à chaque objet, ce qui permet au système de suivre leur position et leur mouvement tout au long de la vidéo.
  • Boîtes de délimitation: Des boîtes de délimitation sont dessinées autour des objets détectés en fonction des résultats de la détection d'objets de YOLO11, qui définissent leur emplacement dans l'image.
  • Sélection d'objets: Il est possible de sélectionner deux objets sur lesquels se concentrer, et YOLO11 met à jour les boîtes de délimitation au fur et à mesure que les objets se déplacent en temps réel.
  • Calcul du centroïde: Les centroïdes (les points centraux des boîtes englobantes des deux objets) sont calculés en fonction des coordonnées des coins des boîtes englobantes, représentant les positions des objets.
  • Calcul de la distance: Les centroïdes des deux objets peuvent ensuite être utilisés pour calculer la distance euclidienne qui les sépare. La distance euclidienne est la distance en ligne droite entre deux points d'un plan 2D, calculée en utilisant les différences dans les directions horizontale et verticale. Elle fournit la distance entre les deux objets en pixels.

Il est important de garder à l'esprit que les distances calculées à l'aide de cette méthode ne sont que des estimations car elles sont basées sur des mesures de pixels en 2D.

Fig 3. Utilisation d'Ultralytics YOLO pour détecter une personne et calculer les distances. 

L'impact de l'estimation de la distance YOLO

Étant donné que le calcul des distances à l'aide de YOLO11 est une estimation, tu peux te demander : Où cela peut-il être utilisé, et en quoi cela peut-il faire la différence ? 

Comme des étalonnages sont utilisés pour parvenir à ces estimations de distance, elles sont suffisamment précises pour être utiles dans de nombreuses situations pratiques. L'estimation de la distance de YOLO11est particulièrement utile dans les environnements dynamiques, comme les entrepôts, où les objets sont constamment en mouvement et où des ajustements en temps réel sont nécessaires pour que tout se passe bien.

Un exemple intéressant est l'utilisation de YOLO11 pour suivre les colis sur un tapis roulant et estimer la distance entre eux en temps réel. Cela aide les responsables d'entrepôt à s'assurer que les paquets sont correctement espacés, ce qui permet d'éviter les collisions et d'assurer le bon déroulement des opérations. 

Dans de tels cas, une distance exacte n'est pas toujours nécessaire. Généralement, une fourchette ou un seuil est fixé pour la distance optimale, de sorte qu'une estimation fonctionne bien pour ce type d'applications.

Fig 4. Détection des paquets à l'aide de YOLO11 et calcul de la distance qui les sépare.

Calcul de la distance dans les applications de vision par ordinateur

Diverses applications de vision par ordinateur peuvent bénéficier du calcul de la distance entre les objets à l'aide de YOLO11. Dans le domaine de l'analyse de la vente au détail, par exemple, cela permet d'améliorer la gestion des files d'attente en suivant les positions des clients en temps réel. Les entreprises peuvent ainsi mieux répartir les ressources, réduire les temps d'attente et créer une expérience d'achat plus fluide. En ajustant dynamiquement les effectifs et en gérant le flux de clients, les magasins peuvent éviter la surpopulation et optimiser l'utilisation de l'espace.

De même, dans la gestion du trafic, l'estimation de la distance permet de surveiller l'espacement des véhicules et d'analyser les schémas de circulation. Cela peut être utilisé pour détecter les comportements dangereux, comme la queue de poisson, et ajuster les feux de circulation pour que le trafic reste fluide. Elle peut contribuer à rendre les routes plus sûres en identifiant les problèmes potentiels et en améliorant la gestion globale du trafic en temps réel.

Fig 5. Le calcul de la distance par la vision peut être utilisé pour surveiller la circulation.

Une autre utilisation unique de cette technologie a eu lieu pendant la pandémie de COVID-19, lorsqu'elle a contribué à promouvoir la distanciation sociale. Elle a permis de s'assurer que les gens gardaient une distance de sécurité dans les espaces publics, les magasins et les hôpitaux, réduisant ainsi le risque de propagation du virus. 

En suivant les distances en temps réel, des alertes pourraient être envoyées lorsque des individus sont trop proches, ce qui permettrait aux entreprises et aux prestataires de soins de santé de réagir plus facilement et rapidement et de maintenir un environnement plus sûr pour tout le monde.

Avantages et inconvénients du calcul de la distance dans la vision par ordinateur

Maintenant que nous avons discuté de certaines des applications du calcul de la distance à l'aide de la vision par ordinateur, voici un examen plus approfondi des avantages qui y sont associés :

  • Automatisation: Vision AI peut automatiser les tâches de calcul de distance qui nécessiteraient autrement un suivi manuel, ce qui réduit les erreurs humaines et les coûts de main-d'œuvre tout en augmentant la productivité.
  • Optimisation des ressources: En connaissant l'espacement approximatif et la proximité des objets, les ressources (comme le personnel ou les machines) peuvent être optimisées, ce qui réduit le gaspillage et améliore les flux de travail.
  • Complexité d'installation minimale: Une fois mis en place, les systèmes de calcul de distance par vision nécessitent relativement peu d'entretien et moins d'intervention humaine par rapport à d'autres systèmes qui reposent sur des entrées manuelles ou des machines complexes.

Malgré ces avantages, il y a aussi certaines limites à garder à l'esprit lors de la mise en œuvre de ces systèmes. Voici un aperçu rapide des facteurs clés à prendre en compte lorsqu'il s'agit de calculer la distance à l'aide de la vision par ordinateur :

  • Sensibilité aux facteurs environnementaux: La précision du calcul de la distance peut être affectée par les conditions d'éclairage, les ombres, les reflets ou les obstructions, ce qui entraîne des erreurs ou des incohérences potentielles.
  • Questions relatives à la protection de la vie privée: L'utilisation de la vision par ordinateur pour suivre des objets ou des personnes peut soulever des problèmes de confidentialité, en particulier dans les espaces publics ou les environnements sensibles où des données personnelles pourraient être impliquées.
  • Complexité dans les scénarios à plusieurs objets: Dans les environnements comportant de nombreux objets en mouvement, le calcul précis des distances entre plusieurs objets simultanément peut prêter à confusion, en particulier s'ils sont proches les uns des autres ou s'ils se croisent.

Principaux enseignements

Le calcul de la distance entre les objets à l'aide de YOLO11 est une solution fiable qui peut aider à la prise de décision. Elle est particulièrement utile dans les environnements dynamiques tels que les entrepôts, la vente au détail et la gestion du trafic, où le suivi de la proximité des objets peut améliorer l'efficacité et la sécurité. 

YOLO11 permet d'automatiser des tâches qui nécessiteraient normalement un effort manuel. Bien qu'il y ait quelques défis à relever, comme la sensibilité aux facteurs environnementaux et les problèmes de confidentialité, les avantages, comme l'automatisation, l'évolutivité et la facilité d'intégration, en font un outil efficace. Comme la vision par ordinateur continue de s'améliorer, en particulier dans des domaines comme le calcul de la distance, il est probable que nous assisterons à un véritable changement dans la façon dont les machines interagissent avec leur environnement et le comprennent.

Rejoins notre communauté! Explore notre dépôt GitHub pour en savoir plus sur la vision artificielle. Si tu souhaites tirer parti de la vision par ordinateur, consulte nos options de licence. Apprends comment la vision par ordinateur dans les soins de santé améliore l'efficacité et vois l'impact de l'IA dans l'agriculture en visitant nos pages de solutions ! 

Logo FacebookLogo de TwitterLogo LinkedInSymbole du lien de copie

Lire la suite dans cette catégorie

Construisons ensemble le futur
de l'IA !

Commence ton voyage avec le futur de l'apprentissage automatique.