Apprends à utiliser le modèle Ultralytics YOLO11 pour une estimation précise de la pose. Nous aborderons l'inférence en temps réel et la formation de modèles personnalisés pour diverses applications.
Les recherches liées à la vision par ordinateur, une branche de l'intelligence artificielle (IA), remontent aux années 1960. Cependant, ce n'est que dans les années 2010, avec l'essor de l'apprentissage profond, que nous avons assisté à des percées majeures dans la façon dont les machines comprennent les images. L'une des dernières avancées en matière de vision par ordinateur sont les modèles de pointe. Ultralytics YOLO11 de pointe. Les modèlesYOLO11 , présentés pour la première fois lors de l'événement hybride annuel Ultralytics', YOLO Vision 2024 (YV24), prennent en charge toute une série de tâches de vision par ordinateur, notamment l'estimation de la pose.
L'estimation de la pose peut être utilisée pour détecter des points clés sur une personne ou un objet dans une image ou une vidéo afin de comprendre sa position, sa posture ou son mouvement. Elle est largement utilisée dans des applications telles que l'analyse sportive, la surveillance du comportement des animaux et la robotique pour aider les machines à interpréter les actions physiques en temps réel. Grâce à sa précision, son efficacité et sa rapidité améliorées par rapport aux modèles précédents de la sérieYOLO (You Only Look Once), YOLO11 est bien adapté aux tâches d'estimation de la pose en temps réel.
Dans cet article, nous verrons ce qu'est l'estimation de la pose, nous discuterons de certaines de ses applications et nous verrons comment tu peux utiliser YOLO11 avec le paquetUltralytics Python pour l'estimation de la pose. Nous verrons également comment tu peux utiliser Ultralytics HUB pour essayer YOLO11 et l'estimation de la pose en quelques clics. C'est parti !
Avant de voir comment utiliser le nouveau modèleUltralytics YOLO11 pour l'estimation de la pose, nous allons mieux comprendre ce qu'est l'estimation de la pose.
L'estimation de la pose est une technique de vision par ordinateur utilisée pour analyser la pose d'une personne ou d'un objet dans une image ou une vidéo. Les modèles d'apprentissage profond comme YOLO11 peuvent identifier, localiser et suivre des points clés sur un objet ou une personne donnés. Pour les objets, ces points clés peuvent inclure des coins, des arêtes ou des marques de surface distinctes, tandis que pour les humains, ces points clés représentent les principales articulations comme le coude, le genou ou l'épaule.
L'estimation de la pose est unique et plus complexe que d'autres tâches de vision par ordinateur telles que la détection d'objets. Alors que la détection d'objets localise les objets dans une image en dessinant une boîte autour d'eux, l'estimation de la pose va plus loin en prédisant les positions exactes des points clés de l'objet.
En ce qui concerne l'estimation de la pose, il y a deux façons principales de procéder : de bas en haut et de haut en bas. L'approche ascendante détecte les points clés individuels et les regroupe en squelettes, tandis que l'approche descendante se concentre d'abord sur la détection des objets, puis sur l'estimation des points clés à l'intérieur de ceux-ci.
YOLO11 combine les points forts des méthodes descendante et ascendante. Comme l'approche ascendante, elle reste simple et rapide sans qu'il soit nécessaire de regrouper les points clés manuellement. En même temps, elle utilise la précision de la méthode descendante en détectant les personnes et en estimant leurs poses en une seule étape.
Les capacités polyvalentes de YOLO11 pour l'estimation de la pose ouvrent un large éventail d'applications possibles dans de nombreux secteurs. Examinons de plus près certains cas d'utilisation de YOLO11 pour l'estimation de la pose.
La sécurité est un aspect important de tout projet de construction. C'est d'autant plus vrai que, statistiquement, les chantiers de construction voient un nombre plus élevé d'accidents du travail. En 2021, environ 20 % de tous les accidents mortels liés au travail se sont produits sur des chantiers de construction ou à proximité. Avec des risques quotidiens comme l'équipement lourd et les systèmes électriques, des mesures de sécurité solides sont essentielles pour assurer la sécurité des travailleurs. Les méthodes traditionnelles comme l'utilisation de panneaux, de barricades et la surveillance manuelle par les superviseurs ne sont pas toujours efficaces et éloignent souvent les superviseurs de tâches plus critiques.
L'IA peut intervenir pour améliorer la sécurité, et le risque d'accident peut être réduit en utilisant un système de surveillance des travailleurs basé sur l'estimation de la pose. Ultralytics YOLO11 Des modèles peuvent être utilisés pour suivre les mouvements et les postures des travailleurs. Tout danger potentiel, comme le fait que les travailleurs se tiennent trop près d'un équipement dangereux ou qu'ils exécutent des tâches de façon incorrecte, peut être rapidement repéré. Si un risque est détecté, les superviseurs peuvent être avertis, ou une alarme peut alerter le travailleur. Un système de surveillance continue peut rendre les chantiers de construction plus sûrs en étant toujours à l'affût des dangers et en protégeant les travailleurs.
Les agriculteurs et les chercheurs peuvent utiliser le site YOLO11 pour étudier les mouvements et le comportement des animaux de ferme, comme le bétail, afin de détecter les signes précoces de maladies telles que la boiterie. La boiterie est un état dans lequel un animal a du mal à se déplacer correctement en raison de douleurs dans les pattes ou les pieds. Chez les bovins, les maladies comme la boiterie affectent non seulement leur santé et leur bien-être, mais entraînent également des problèmes de production dans les exploitations laitières. Des études montrent que les boiteries touchent entre 8 % des bovins dans les systèmes basés sur les pâturages et 15 à 30 % dans les systèmes confinés dans l'ensemble de l'industrie laitière mondiale. La détection et la prise en charge précoce de la boiterie peuvent contribuer à améliorer le bien-être des animaux et à réduire les pertes de production associées à cette affection.
YOLO11Les fonctions d'estimation de la pose du logiciel peuvent aider les éleveurs à suivre les modèles de démarche de l'animal et à identifier rapidement toute anomalie susceptible de signaler des problèmes de santé, tels que des problèmes d'articulation ou des infections. La détection précoce de ces problèmes permet un traitement plus rapide, réduisant ainsi l'inconfort des animaux et aidant les agriculteurs à éviter les pertes économiques.
Les systèmes de surveillance activés par Vision AI peuvent également aider à analyser le comportement au repos, les interactions sociales et les modes d'alimentation. Les agriculteurs peuvent également utiliser l'estimation de la pose pour obtenir des observations sur les signes de stress ou d'agression. Ces observations peuvent être utilisées pour cultiver de meilleures conditions de vie pour les animaux et augmenter leur bien-être.
L'estimation des poses peut également aider les gens à améliorer leur posture en temps réel pendant qu'ils s'entraînent. Avec YOLO11, les professeurs de gymnastique et de yoga peuvent surveiller et suivre les mouvements du corps des personnes qui s'entraînent, en se concentrant sur des points clés comme les articulations et les membres pour évaluer leur posture. Les données recueillies peuvent être comparées aux poses idéales et aux techniques d'entraînement, et les instructeurs peuvent recevoir des alertes si quelqu'un exécute un mouvement de façon incorrecte, ce qui permet d'éviter les blessures.
Par exemple, pendant un cours de yoga, l'estimation de la pose peut aider à vérifier si tous les élèves maintiennent un équilibre et un alignement corrects. Les applications mobiles intégrées à la vision par ordinateur et à l'estimation de la pose peuvent rendre le fitness plus accessible aux personnes qui s'entraînent à la maison ou à celles qui n'ont pas accès à des entraîneurs personnels. Ce retour d'information continu en temps réel aide les utilisateurs à améliorer leur technique et à atteindre leurs objectifs de remise en forme tout en réduisant le risque de blessure.
Maintenant que nous avons exploré ce qu'est l'estimation de la pose et discuté de certaines de ses applications. Voyons maintenant comment tu peux essayer l'estimation de la pose avec le nouveau modèle YOLO11 . Pour commencer, il y a deux façons pratiques de le faire : en utilisant le paquet Ultralytics Python ou en utilisant Ultralytics HUB. Examinons ces deux options.
L'exécution d'une inférence implique que le modèle YOLO11 traite de nouvelles données en dehors de ses ensembles d'apprentissage et utilise les modèles qu'il a appris pour faire des prédictions basées sur ces données. Tu peux exécuter des inférences par le biais du code avec le paquetage Ultralytics Python . Pour commencer , il te suffit d'installer le paquet Ultralytics à l'aide de pip, conda ou Docker. Si tu rencontres des difficultés lors de l'installation, notre Guide des problèmes courants propose des conseils de dépannage utiles.
Une fois que tu as installé le paquet avec succès, le code suivant explique comment charger un modèle et l'utiliser pour prédire les poses des objets dans une image.
Disons que tu travailles sur un projet de vision par ordinateur et que tu as un ensemble de données spécifiques pour une application particulière impliquant l'estimation de la pose. Tu peux alors affiner et former un modèle YOLO11 personnalisé pour l'adapter à ton application. Par exemple, tu peux utiliser un ensemble de données de points clés pour analyser et comprendre la pose d'un tigre sur des images en identifiant des caractéristiques clés telles que la position de ses membres, de sa tête et de sa queue.
Tu peux utiliser l'extrait de code suivant pour charger et entraîner un modèle d'estimation de pose YOLO11 . Le modèle peut être construit à partir d'une configuration YAML, ou tu peux charger un modèle pré-entraîné pour l'entraînement. Ce script te permet également de transférer des poids et de commencer à entraîner le modèle à l'aide d'un ensemble de données spécifié, tel que l'ensemble de données COCO pour l'estimation de la pose.
À l'aide du modèle personnalisé nouvellement formé, tu peux effectuer des déductions sur des images inédites liées à ta solution de vision par ordinateur. Le modèle formé peut également être converti dans d'autres formats à l'aide du mode d'exportation.
Jusqu'à présent, nous avons examiné les méthodes d'utilisation de YOLO11 nécessitant quelques connaissances de base en matière de codage. Si ce n'est pas ce que tu recherches, ou si tu n'es pas familier avec le codage, il existe une autre option : Ultralytics HUB. Ultralytics HUB est une plateforme conviviale conçue pour simplifier le processus de formation et de déploiement des modèles YOLO . HUB te permet de gérer facilement des ensembles de données, de former des modèles et de les déployer sans avoir besoin d'expertise technique.
Pour effectuer des déductions sur des images, tu peux créer un compte, naviguer dans la section "Modèles" et choisir le modèle d'estimation de pose YOLO11 qui t'intéresse. Dans la section de prévisualisation, tu peux télécharger une image et voir les résultats de la prédiction, comme indiqué ci-dessous.
Ultralytics YOLO11 offre des solutions précises et flexibles pour des tâches telles que l'estimation de la pose dans une large gamme d'applications. Qu'il s'agisse d'améliorer la sécurité des travailleurs sur les chantiers de construction, de surveiller la santé du bétail ou d'aider à la correction de la posture dans les programmes de remise en forme, YOLO11 apporte de la précision et un retour d'information en temps réel grâce à une technologie avancée de vision par ordinateur.
Sa polyvalence, avec de multiples variantes de modèles et la possibilité de former sur mesure pour des cas d'utilisation spécifiques, en fait un outil très précieux pour les développeurs et les entreprises. Que ce soit en codant avec le paquet Ultralytics Python ou en utilisant le HUB Ultralytics pour une mise en œuvre plus facile, YOLO11 rend l'estimation de pose accessible et percutante.
Pour en explorer davantage, visite notre dépôt GitHub et engage-toi auprès de notre communauté. Explore les applications de l'IA dans la fabrication et l'agriculture sur nos pages de solutions. 🚀
Commence ton voyage avec le futur de l'apprentissage automatique.