En cliquant sur "Accepter tous les cookies", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser l'utilisation du site et de nous aider dans nos efforts de marketing. Plus d'informations
Paramètres des cookies
En cliquant sur "Accepter tous les cookies", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser l'utilisation du site et de nous aider dans nos efforts de marketing. Plus d'informations
Apprenez à transformer les images de vision par ordinateur en informations commerciales significatives. Découvrez comment relier les points entre les images et les données pour prendre de meilleures décisions.
La vision par ordinateur est un sous-domaine de l'intelligence artificielle (IA) qui permet aux machines d'interpréter et de prendre des décisions sur la base de données visuelles. Lorsqu'une application de vision par ordinateur est présentée, elle inclut généralement divers résultats visuels, tels que des images ou des vidéos, annotés avec des boîtes de délimitation ou des masques de segmentation pour mettre en évidence les objets d'intérêt. Si ces visuels sont impressionnants, ils ne donnent pas toujours une image claire des informations exploitables qu'ils peuvent fournir.
Prenons l'exemple d'un magasin de détail. Un modèle de vision artificielle comme Ultralytics YOLOv8 peut être utilisé pour créer une carte thermique montrant où les clients passent le plus de temps. La visualisation peut ressembler à une carte colorée indiquant les endroits où la plupart des clients ont tendance à marcher ou à s'attarder. Cependant, le véritable avantage est de pouvoir identifier les sections les moins performantes du magasin. Les détaillants peuvent utiliser ces informations exploitables pour réorganiser l'emplacement des produits, optimiser l'espace en rayon ou ajuster les affichages promotionnels afin d'accroître l'engagement des clients et d'augmenter les ventes.
Fig. 1. Exemple de carte thermique créée pour un magasin de détail à l'aide de YOLOv8.
La valeur réelle de la vision par ordinateur réside dans la traduction de ces sorties visuelles en informations commerciales significatives qui peuvent directement améliorer et optimiser les opérations pour stimuler la croissance et l'efficacité. Dans cet article, nous examinerons ce que la vision par ordinateur peut offrir aux entreprises et comment elle peut avoir un impact réel sur leurs opérations. Nous aborderons également les stratégies permettant d'aller au-delà des résultats visuels et d'exploiter des informations exploitables pour obtenir des résultats concrets. C'est parti !
Visualisation vs. compréhension dans l'IA : les idées fausses les plus répandues
Commençons par comprendre la différence entre les visualisations et les informations. Dans le domaine de la vision par ordinateur, les visualisations telles que les boîtes de délimitation et les cartes thermiques sont importantes pour comprendre les résultats du modèle. Ces sorties visuelles servent de tremplin pour illustrer ce que la vision par ordinateur peut et ne peut pas faire. Les aperçus, cependant, vont au-delà de ces visuels et offrent des informations précieuses qui peuvent être utilisées pour prendre des décisions éclairées, améliorer les processus ou comprendre les modèles plus en profondeur. Ils transforment les données visuelles brutes en conclusions significatives qui permettent de découvrir des tendances, de prédire des résultats ou d'optimiser des stratégies.
Par exemple, un système de surveillance de l'entraînement par vision artificielle peut utiliser l'estimation de la pose et des modèles comme YOLOv8 pour suivre les mouvements du corps en identifiant les points clés tels que les articulations et les membres. Le résultat visuel, comme des squelettes animés montrant comment une personne se déplace, peut être intéressant à regarder. Cependant, la valeur réelle provient des informations quantifiables que ces données fournissent, telles que le nombre de pompes ou de squats effectués, la durée de chaque exercice, la cohérence des répétitions et la qualité de la forme maintenue tout au long de la session.
Les entraîneurs peuvent utiliser ces informations pour analyser les formes d'exercice de leurs clients, repérer les mouvements incorrects susceptibles de provoquer des blessures, suivre les performances dans le temps et comprendre les habitudes d'entraînement. Ces informations permettent aux entraîneurs de donner un meilleur feedback, de concevoir des plans d'entraînement plus efficaces et d'aider les clients à atteindre leurs objectifs de remise en forme de manière plus sûre et plus efficace.
Fig. 2. Utilisation de YOLOv8 pour suivre les mouvements du corps.
La vision par ordinateur au service de la valeur commerciale
À mesure que la technologie progresse, les entreprises sont toujours à la recherche de moyens pour rester en tête de la concurrence, et la vision par ordinateur est un excellent moyen d'y parvenir. En incorporant des informations issues de la vision par ordinateur dans leurs flux de travail existants, elles peuvent obtenir des résultats réels et mesurables.
Ces données peuvent fournir des informations précieuses dans divers domaines de l'entreprise, tels que
Mesure de la performance: Données quantitatives qui mettent en évidence des indicateurs et des modèles de performance clés.
Analyse des tendances: Comprendre les tendances émergentes et les changements dans le comportement des clients ou les conditions du marché au fil du temps.
Perspectives prédictives: Prévision des résultats futurs ou identification des problèmes potentiels à l'aide de données passées et en temps réel.
Alertes en temps réel: Notifications instantanées en cas d'événements importants, d'anomalies ou de changements nécessitant une attention particulière.
Par exemple, dans l'industrie pétrolière et gazière, la détection des incendies ou des fuites de gaz dans les fours était traditionnellement assurée par une surveillance manuelle ou des systèmes de capteurs de base. Ces méthodes manquent souvent de la rapidité et de la précision nécessaires pour détecter rapidement les risques potentiels. La vision par ordinateur peut améliorer ce processus en utilisant des caméras et des modèles de détection d'objets tels que YOLOv8 pour surveiller en permanence les fours et repérer rapidement les problèmes tels que des flammes inhabituelles, un excès de fumée ou des fuites de gaz.
Le résultat visuel de cette application pourrait se présenter sous la forme de boîtes de délimitation sur les images qui mettent en évidence les zones où un incendie a été détecté. Cependant, le véritable avantage réside dans la transformation de ces indices visuels en informations exploitables. Ces informations peuvent aider à déterminer la cause d'un incendie, à prévoir les problèmes d'équipement et à planifier la maintenance pour éviter les problèmes futurs. Grâce à ces informations, les entreprises industrielles peuvent réagir rapidement aux incendies potentiels, éviter des dommages coûteux, réduire les temps d'arrêt et améliorer la sécurité et l'efficacité.
Fig. 3. Utilisation de YOLOv8 pour détecter les incendies.
Prise de décision fondée sur les données grâce à l'IA
Les sorties visuelles d'un modèle entraîné peuvent être transformées en informations qui sont organisées dans des tableaux de bord et des bases de données en vue d'une analyse plus approfondie. Les tableaux de bord, en particulier, peuvent aider les chefs d'entreprise à avoir une vision claire des mesures de performance, à repérer les anomalies et à prendre des décisions fondées sur des données en temps réel.
Par exemple, dans le cadre de la surveillance du trafic, un modèle de vision par ordinateur tel que YOLOv8 peut être utilisé pour analyser des séquences de trafic en direct afin de détecter et de suivre différents véhicules, tels que des voitures, des camionnettes et des bus, sur la route. La visualisation de sortie peut montrer des véhicules étiquetés et suivre le nombre de véhicules entrant et sortant de zones spécifiques. Ces informations peuvent également être affichées sur un tableau de bord qui fournit une ventilation du nombre de véhicules par zone et calcule des indicateurs clés tels que le nombre total de véhicules et la vitesse moyenne.
Fig. 4. Utilisation de YOLOv8 pour détecter et suivre le trafic.
Ces informations aident les équipes de gestion du trafic à comprendre les flux de circulation, à identifier les points de congestion, à prévoir les embouteillages et à ajuster les feux de circulation ou les itinéraires pour assurer la fluidité du trafic. En transformant les données visuelles en informations exploitables, ce système aide les urbanistes à prendre des décisions intelligentes pour améliorer la fluidité du trafic et réduire les problèmes sur la route.
Combler le fossé entre l'IA et les besoins des entreprises
Maintenant que nous avons discuté de l'impact commercial des informations exploitables issues de la vision par ordinateur, examinons les stratégies permettant de combler le fossé entre la visualisation des données et les informations commerciales. Lors du développement de solutions d'IA, ces considérations sont essentielles car elles permettent d'aller au-delà des simples tâches de vision par ordinateur et de comprendre le contexte et les relations au sein des données. Une analyse approfondie permet de créer des informations plus significatives et plus pertinentes pour les besoins de l'entreprise.
Pour commencer, il est essentiel d'améliorer la communication entre les développeurs d'IA et les chefs d'entreprise. Les développeurs d'IA peuvent avoir des discussions ouvertes avec les parties prenantes de l'entreprise pour comprendre leurs objectifs, leurs défis et ce qu'ils espèrent réaliser. En se plaçant du point de vue du chef d'entreprise, il est plus facile de déterminer comment la vision par ordinateur peut directement résoudre des problèmes spécifiques. Plutôt que de développer des solutions génériques, les développeurs peuvent se concentrer sur la création d'applications de vision par ordinateur qui répondent aux besoins réels des entreprises.
Par exemple, dans le scénario de l'industrie pétrolière et gazière que nous avons évoqué plus haut, le fait de discuter directement avec une partie prenante de l'entreprise peut aider un développeur à comprendre des besoins spécifiques, comme l'envoi d'alertes en fonction de la taille et de la gravité d'un incendie détecté. La connaissance de ces détails aide les développeurs à personnaliser la solution pour donner la priorité aux alertes critiques, ce qui garantit des temps de réponse plus rapides et réduit les risques, ce qui renforce la sécurité et l'efficacité.
Fig. 5. La communication est essentielle. Source de l'image : Envato Elements.
Une fois qu'une communication claire est établie, l'étape suivante consiste à se concentrer sur la qualité et le traitement des données. Les développeurs peuvent s'assurer que les données utilisées pour la formation et l'analyse sont propres, cohérentes et pertinentes par rapport aux besoins du client. La rationalisation du traitement des données peut contribuer à réduire les délais et à fournir des informations précises et opportunes. Par ailleurs, l'intégration des systèmes de vision par ordinateur aux outils commerciaux existants peut améliorer la prise de décision et permettre aux entreprises de réagir rapidement aux informations importantes.
Voici d'autres facteurs à prendre en considération :
Visualisation conviviale: Veiller à ce que les résultats visuels soient simples et faciles à interpréter pour les parties prenantes non techniques.
Évolutivité: Concevoir des solutions d'IA capables de s'adapter aux besoins croissants de l'entreprise en matière de données et aux changements opérationnels.
Analyse en temps réel: Incorporez le traitement des données en temps réel afin de fournir des informations opportunes qui peuvent entraîner une action immédiate.
Sécurité et vie privée: Protéger l'intégrité et la confidentialité des données, en particulier lorsqu'il s'agit d'informations sensibles.
Apprentissage continu et adaptation: Mettre en œuvre des mécanismes d'apprentissage continu et de mise à jour des modèles pour s'adapter à l'évolution des environnements commerciaux et des modèles de données.
L'avenir de la vision par ordinateur pour les entreprises
Si les sorties visuelles, telles que les boîtes englobantes et les masques, démontrent les capacités de la vision par ordinateur, les entreprises ont besoin de plus que de simples représentations visuelles ; elles ont besoin d'informations exploitables qui peuvent conduire à la prise de décision et à l'amélioration des opérations. En comprenant les objectifs de l'entreprise et en appliquant la vision par ordinateur à des problèmes réels, les développeurs peuvent fournir des informations qui améliorent les opérations et l'expérience des clients et réduisent les coûts.
Pour combler le fossé entre la visualisation et les informations exploitables, les développeurs peuvent communiquer clairement avec les parties prenantes, utiliser des données de haute qualité et améliorer le traitement des données. Ces étapes aident les entreprises à tirer le meilleur parti de la technologie de vision par ordinateur, en transformant les informations en avantages réels.
Apprenons et explorons ensemble ! Consultez notre dépôt GitHub pour voir nos contributions à l'IA, et n'oubliez pas de vous engager auprès de notre communauté. Découvrez comment nous redéfinissons des secteurs tels que la fabrication et les soins de santé grâce à une technologie d'IA de pointe.