Rejoins-nous pour revisiter la keynote YOLO Vision 2024 de David Scott sur l'analyse comportementale pilotée par l'IA et ses applications concrètes dans des secteurs comme l'élevage.
Pendant de nombreuses années, les innovations en matière de vision par ordinateur se sont concentrées sur des tâches telles que la détection d'objets - l'identification d'objets tels qu'un chien ou une voiture dans des images et des vidéos. Ces approches ont permis des applications dans des domaines tels que les véhicules autonomes, la fabrication et les soins de santé.
Cependant, ces tâches se concentrent souvent uniquement sur l'identification de ce qu'est un objet. Et si les systèmes Vision AI pouvaient aller plus loin ? Par exemple, au lieu de simplement détecter un chien, disons qu'il pourrait comprendre que le chien poursuit une balle ou qu'une voiture freine brusquement parce qu'un piéton traverse. Ce passage de la reconnaissance de base à la compréhension contextuelle représente une évolution majeure vers une IA comportementale plus intelligente et consciente du contexte.
Lors de YOLO Vision 2024 (YV24), Ultralytics' événement hybride annuel célébrant les avancées en matière d'IA Vision, le concept d'analyse comportementale pilotée par l'IA a occupé le devant de la scène lors d'une intéressante intervention de David Scott, PDG de The Main Branch.
Dans son exposé, David a exploré la transition entre les tâches de base de la vision par ordinateur et le suivi comportemental. Avec plus de 25 ans d'expérience dans la création d'applications technologiques de pointe, il a montré l'impact de ce saut. Il a insisté sur la façon dont le décodage des modèles et des comportements remodèle des industries comme l'agriculture et le bien-être des animaux.
Dans cet article, nous allons parcourir les points forts de la conférence de David et explorer comment le suivi comportemental rend l'IA plus pratique.
David Scott a commencé son discours par une confrontation audacieuse à la réalité en déclarant : "Un de mes collègues dit souvent : "La science ne se vend pas", ce qui offense beaucoup d'entre nous ici parce que nous aimons vraiment la science. L'IA est vraiment cool - pourquoi les gens ne l'achèteraient-ils pas ? Mais en réalité, les gens ne veulent pas l'acheter simplement parce que nous pensons que c'est cool ; ils ont besoin d'une raison pour l'acheter."
Il a poursuivi en expliquant que dans son entreprise, The Main Branch, l'accent est toujours mis sur la résolution de problèmes réels avec l'IA, et pas seulement sur l'étalage de ses capacités. Beaucoup de clients viennent en voulant parler de la façon dont ils peuvent utiliser l'IA en général, mais il considère que c'est une approche rétrograde - c'est comme avoir une solution sans problème. Au lieu de cela, ils travaillent avec des clients qui présentent des défis spécifiques afin de pouvoir créer des solutions d'IA qui font réellement la différence.
David a également partagé que leur travail va souvent au-delà de la simple reconnaissance des objets dans une scène. Repérer ce qui est là n'est que la première étape. La vraie valeur vient du fait de trouver quoi faire avec ces informations et de les rendre utiles dans la chaîne de valeur plus large.
Une étape essentielle pour rendre l'IA vraiment utile est d'aller au-delà des tâches de vision informatique de base comme la détection d'objets et d'utiliser ces connaissances pour le suivi comportemental. David a souligné que l'IA comportementale se concentre sur la compréhension des actions et des modèles, et pas seulement sur l'identification des objets. Cela rend l'IA capable de reconnaître des événements significatifs et de fournir des informations exploitables.
Il a donné l'exemple d'un animal qui se roule par terre, ce qui peut indiquer une maladie. Si les gens ne peuvent pas surveiller un animal 24 heures sur 24, les systèmes de surveillance pilotés par l'IA et dotés de capacités de suivi comportemental le peuvent. De telles solutions peuvent surveiller les objets en continu, détecter des comportements spécifiques, envoyer une alerte et permettre une action opportune. Les données brutes sont ainsi transformées en quelque chose de pratique et de précieux.
David a également montré que cette approche rend l'IA non seulement intéressante, mais véritablement impactante. En s'attaquant à des problèmes réels, comme surveiller les comportements et agir en conséquence, le suivi comportemental peut devenir un élément clé des solutions d'IA efficaces dans divers secteurs d'activité.
David Scott a ensuite illustré comment Ultralytics YOLOv8David Scott a ensuite illustré comment le modèle de vision par ordinateur, a constitué une percée pour les projets de suivi comportemental de son équipe. Il leur a donné une base solide pour détecter, classer et suivre les objets. Son équipe est également allée plus loin en formant sur mesure YOLOv8 pour qu'il se concentre sur le suivi des comportements au fil du temps, ce qui le rend plus pratique et plus utile dans des situations réelles.
Il est intéressant de noter qu'avec la sortie de Ultralytics YOLO11, des solutions comme celles créées par The Main Branch peuvent devenir encore plus fiables et plus précises. Ce dernier modèle offre des fonctionnalités telles qu'une meilleure précision et un traitement plus rapide qui améliorent sa capacité à suivre les comportements. Nous en parlerons plus en détail après avoir mieux compris les applications pour lesquelles l'IA comportementale peut être utilisée.
Ensuite, explorons les solutions dont David a parlé et la façon dont la technologie de suivi comportemental est utilisée dans des applications réelles pour résoudre des défis quotidiens et avoir un impact significatif.
Tout d'abord, David nous a fait part d'un défi passionnant qu'ils ont relevé dans le cadre d'un projet appelé HerdSense, qui consistait à surveiller la santé de milliers de vaches dans un immense parc d'engraissement. L'objectif était de suivre le comportement de chaque vache afin d'identifier les problèmes de santé potentiels. Il fallait donc surveiller des dizaines de milliers d'animaux en même temps, et ce n'était pas une tâche facile.
Pour commencer à résoudre le problème de l'identification de chaque vache et du suivi de ses comportements, l'équipe de David a organisé un atelier de deux jours pour décrire tous les comportements possibles qu'ils devaient surveiller. Ils ont identifié plus de 200 comportements au total.
Chacun des 200 comportements dépendait de la capacité à reconnaître avec précision les vaches individuelles, car toutes les données devaient être liées à des animaux spécifiques. L'un des problèmes majeurs était de suivre les vaches lorsqu'elles se regroupaient en troupeaux, ce qui rendait difficile de voir les animaux individuellement.
L'équipe de David a mis au point un système de vision par ordinateur pour s'assurer que chaque vache est toujours identifiée, même dans des situations délicates. Ils ont pu confirmer que la même vache se verrait toujours attribuer le même identifiant, même si elle disparaissait du champ de vision, se mêlait à d'autres ou réapparaissait plus tard.
David a ensuite présenté un autre projet fascinant dans le cadre duquel ils ont appliqué des techniques de suivi comportemental similaires pour surveiller les chevaux. Dans ce projet, l'équipe de David n'a pas eu besoin de suivre les chevaux individuellement aussi étroitement qu'avec les vaches. Ils se sont plutôt concentrés sur des comportements spécifiques et ont suivi des détails tels que les habitudes alimentaires et le niveau d'activité général afin de repérer rapidement tout problème de santé. L'identification de petits changements de comportement pourrait conduire à des interventions plus rapides pour fournir de meilleurs soins et prévenir les problèmes avant qu'ils ne deviennent sérieux.
David a également abordé la complexité du suivi comportemental à travers un exemple intriguant. Alors qu'elle recherchait des moyens d'améliorer l'analyse comportementale, son équipe est tombée sur une entreprise qui prétendait détecter les vols à l'étalage en analysant des poses spécifiques, comme celle d'une personne qui a la main dans la poche. Au début, cela semblait être une idée intelligente - certains mouvements pouvaient suggérer un comportement suspect, n'est-ce pas ?
Cependant, en explorant davantage, David s'est rendu compte des limites de cette méthode. Une seule pose, comme une main dans une poche, ne signifie pas nécessairement que quelqu'un est en train de voler à l'étalage. Elle peut simplement indiquer qu'elle est détendue, qu'elle réfléchit ou même qu'elle a froid. Le problème lorsqu'on se concentre sur des poses isolées, c'est qu'on ne tient pas compte du contexte plus large. Le comportement ne se résume pas à une seule action - c'est un ensemble d'actions au fil du temps, façonné par le contexte et l'intention.
David a souligné que le véritable suivi comportemental est beaucoup plus complexe et nécessite une approche holistique. Il s'agit d'analyser des séquences d'actions et de comprendre ce qu'elles signifient dans un contexte plus large. Bien que l'industrie de l'IA fasse des progrès, il a noté qu'il y a encore du travail à faire pour faire progresser le suivi comportemental afin de fournir des informations significatives et précises.
David a ensuite emmené le public dans les coulisses pour lui montrer comment son équipe a construit une solution de vision artificielle pour surveiller la santé des vaches à l'aide de YOLOv8, et de ses capacités d'estimation de la pose.
Ils ont commencé par créer un ensemble de données personnalisé pour l'estimation de la pose d'une vache, en augmentant le nombre standard de points clés de 17 à 145 pour que le modèle analyse mieux les mouvements. Ensuite, le modèle a été entraîné sur un énorme ensemble de données comprenant plus de 2 millions d'images et 110 millions d'exemples de comportement.
Grâce à une infrastructure matérielle avancée, l'équipe de David a pu former le modèle en deux jours seulement, au lieu des semaines qu'il aurait fallu avec un matériel conventionnel. Le modèle formé a ensuite été intégré à un traqueur de comportement personnalisé qui a analysé plusieurs images vidéo simultanément pour détecter des schémas dans les actions des vaches.
Le résultat a été une solution visionnaire pilotée par l'IA qui peut détecter et suivre huit comportements différents des vaches, comme manger, boire et se coucher, afin de repérer les changements de comportement mineurs qui pourraient signaler des problèmes de santé. Cela permet aux agriculteurs d'agir rapidement et d'améliorer la gestion du troupeau.
David a conclu son intervention en partageant une leçon importante avec le public : "Si vous ne donnez pas à l'IA la possibilité d'échouer, vous vous exposez à l'échec car, en fin de compte, il s'agit de statistiques." Il a souligné que l'IA, malgré ses atouts, n'est pas sans faille. C'est un outil qui apprend à partir de modèles, et il y aura toujours des moments où elle ne fera pas les choses correctement. Au lieu de craindre ces erreurs, la clé est de construire des systèmes qui peuvent les gérer et continuer à s'améliorer au fil du temps.
Il en va de même pour les modèles de vision par ordinateur. Par exemple, Ultralytics YOLO11 , la dernière version des modèles Ultralytics YOLO , a été construite en gardant à l'esprit la nécessité de passer à la vitesse supérieure par rapport à YOLOv8.
En particulier, YOLO11 offre de meilleures performances, notamment en ce qui concerne les applications en temps réel où la précision est essentielle, comme l'agriculture et les soins de santé. Grâce à ses fonctionnalités avancées, YOLO11 redéfinit la façon dont les industries utilisent l'IA en fournissant des informations innovantes en temps réel et en les aidant à relever les défis plus efficacement.
La conférence de David à YV24 nous a rappelé que l'IA est plus qu'une innovation cool - c'est un outil puissant pour résoudre des problèmes réels et améliorer notre façon de vivre et de travailler. En se concentrant sur le comportement, l'IA a déjà un impact dans des domaines tels que le suivi de la santé des animaux et la reconnaissance de schémas significatifs dans les actions quotidiennes.
Le potentiel de l'IA comportementale est passionnant, et nous n'en sommes qu'au début. En transformant les données brutes en informations exploitables, l'IA comportementale passe d'une surveillance passive à une résolution active des problèmes. À mesure qu'elle se développe, l'IA comportementale est appelée à favoriser des décisions plus intelligentes, à rationaliser les processus et à apporter des améliorations significatives à nos vies.
Reste connecté avec notre communauté pour en savoir plus sur l'IA et ses applications dans le monde réel. Visite notre dépôt GitHub pour découvrir des innovations dans des domaines tels que l 'IA dans l'agriculture et la vision par ordinateur dans la fabrication.
Commence ton voyage avec le futur de l'apprentissage automatique.