Apprends comment le nouveau modèle Ultralytics YOLO11 améliore la classification des images, offrant une meilleure précision pour les tâches dans l'agriculture, la vente au détail et la surveillance de la faune et de la flore.
Imaginons qu'un robot regarde deux chats, l'un noir et l'autre blanc, et qu'il doive déterminer lequel est lequel. Pour ce faire, il peut utiliser la classification d'images, une tâche de vision par ordinateur qui permet d'identifier et de catégoriser des objets ou des scènes dans une image. En fait, grâce aux progrès récents de l'intelligence artificielle (IA), la classification d'images peut être utilisée dans une grande variété d'applications allant de la surveillance des animaux à la fabrication et à l'agriculture avec la détection des maladies des cultures.
L'une des dernières avancées en matière de classification d'images est le modèleUltralytics YOLO11 . Lancé lors de l' événement hybride annuelUltralytics', YOLO Vision 2024 (YV24), YOLO11 est conçu pour s'attaquer à une grande variété de tâches d'IA Vision, y compris la classification d'images, avec facilité et précision.
Dans cet article, nous allons explorer les principes fondamentaux de la classification des images, discuter des applications du monde réel et te montrer comment tu peux utiliser YOLO11 pour la classification d'images grâce au paquetageUltralytics Python . Nous verrons également comment tu peux tester les capacités de YOLO11sur le HUB Ultralytics en quelques étapes simples. C'est parti !
La classification des images consiste à attribuer une étiquette à une image en se basant sur des modèles appris à partir d'images déjà étiquetées. En analysant soigneusement les pixels d'une image, un modèle de vision par ordinateur peut trouver la meilleure correspondance pour l'image. Des modèles fiables comme YOLO11 peuvent gérer ce processus de façon transparente. YOLO11L'architecture du modèle d'OCLC permet de traiter les images ou les trames vidéo presque instantanément, ce qui le rend idéal pour les applications qui nécessitent une classification rapide et précise des images.
Pour vraiment comprendre la portée de la classification des images, il est utile de la distinguer d'autres tâches comme la détection d'objets. Alors que la classification d'images étiquette une image entière, la détection d'objets identifie et localise chaque objet dans l'image.
Considérons l'image d'une girafe. Dans la classification d'images, le modèle pourrait étiqueter l'image entière comme étant simplement une girafe en se basant sur son contenu global. Cependant, avec la détection d'objets, le modèle ne se contente pas d'identifier la girafe ; il place également une boîte englobante autour de la girafe, en précisant son emplacement exact dans l'image.
Maintenant, imagine que la girafe se trouve près d'un arbre dans une savane avec d'autres animaux. Un modèle de classification d'images pourrait étiqueter la scène entière comme étant une savane ou simplement de la faune. Cependant, avec la détection d'objets, le modèle identifierait chaque élément individuellement, en reconnaissant la girafe, l'arbre et les autres animaux, chacun avec ses propres boîtes de délimitation.
La précision et les performances du modèle Ultralytics YOLO11 pour la classification des images le rendent utile dans un grand nombre de secteurs d'activité. Explorons quelques-unes des principales applications de YOLO11 dans la classification des images.
La classification des images peut contribuer à rationaliser de nombreuses fonctions dans l'industrie agricole. Plus précisément, en utilisant des modèles de classification d'images comme YOLO11, les agriculteurs peuvent surveiller en permanence la santé de leurs cultures, détecter les maladies graves et identifier les infestations de parasites avec une grande précision.
Voici un aperçu de la façon dont cela fonctionne :
La classification d'images peut améliorer considérablement l'expérience d'achat au détail, en la rendant plus personnalisée et plus conviviale. Les détaillants peuvent utiliser des modèles de vision par ordinateur formés sur mesure pour reconnaître les produits de leur inventaire et intégrer cette capacité dans leurs applications mobiles ou leurs sites Web. Les clients peuvent alors rechercher des produits simplement en téléchargeant une photo, ce qui rend les achats plus rapides et plus pratiques.
Une fois qu'un client télécharge une image dans un système de recherche visuelle, plusieurs choses se produisent en coulisses avant que les résultats de la recherche ne s'affichent.
Tout d'abord, la détection d'objets peut être utilisée pour repérer les principaux éléments de l'image, comme l'identification d'un vêtement ou d'un meuble et sa séparation de l'arrière-plan. Ensuite, la classification de l'image peut être utilisée pour catégoriser davantage chaque élément, en reconnaissant s'il s'agit d'une veste, d'une chemise, d'un canapé ou d'une table.
Grâce à ces informations, le système peut faire apparaître des produits similaires disponibles à l'achat, ce qui est particulièrement utile pour trouver des articles uniques ou à la mode qu'il est difficile de décrire avec des mots. La même technologie peut également aider à rationaliser d'autres tâches liées à la vente au détail, comme la gestion des stocks, en reconnaissant et en classant automatiquement les articles.
Traditionnellement, la surveillance des animaux dans la nature est une tâche fastidieuse qui implique de nombreuses personnes triant et analysant manuellement des milliers de photos. Grâce à des modes de vision par ordinateur comme YOLO11, les chercheurs peuvent surveiller automatiquement les animaux à un rythme plus rapide. Des caméras peuvent être placées dans des habitats naturels pour prendre des photos. Le modèle de vision artificielle peut ensuite être utilisé pour analyser ces photos et classer les animaux qui s'y trouvent (le cas échéant). Un tel système peut aider les chercheurs à étudier et à suivre les populations animales, leurs schémas de migration, etc.
Une autre façon dont les modèles d'IA et de vision par ordinateur comme YOLO11 peuvent aider dans ce domaine est de rationaliser le processus de classification des espèces en voie de disparition. En identifiant les espèces potentielles ou les catégories de races auxquelles un animal peut appartenir, ces modèles peuvent fournir des données essentielles aux chercheurs. Par exemple, l'Université de Tasmanie (UTAS) a mis au point un système basé sur la classification des images pour surveiller différentes espèces sauvages de Tasmanie. Les prédictions des modèles peuvent alors aider les scientifiques et les chercheurs à garder un œil sur l'activité et le comportement des animaux, qui peuvent signaler des menaces telles que le braconnage ou la perte d'habitat.
Maintenant que nous avons discuté de ce qu'est la classification d'images et exploré certaines de ses applications. Voyons comment tu peux essayer la classification d'images avec le nouveau modèle YOLO11 . Il y a deux façons simples de commencer : en utilisant le paquetUltralytics Python ou en utilisant Ultralytics HUB. Nous allons passer en revue les deux options.
Pour commencer à utiliser le paquet Ultralytics Python , il suffit de l'installer à l'aide de pip, conda ou Docker. Si tu rencontres des problèmes, consulte notre Guide des problèmes courants pour obtenir des conseils de dépannage utiles.
Une fois le paquet installé, tu peux utiliser le code suivant pour charger une variante du modèle de classification d'images YOLO11 et exécuter une inférence sur une image. Exécuter une inférence signifie utiliser un modèle entraîné pour faire des prédictions sur de nouvelles données inédites. Tu peux essayer avec une image de ton choix !
Tu peux également utiliser le même logiciel Python pour former un modèle de classification personnalisé YOLO11 . L'entraînement personnalisé te permet d'affiner un modèle YOLO11 en fonction de tes besoins spécifiques. Par exemple, si tu développes une application pour classer les différentes races de chats, tu peux entraîner un modèle YOLO11 spécialement à cette fin.
Le code ci-dessous montre comment charger et entraîner un modèle de classification d'images YOLO11 . Il te permet de transférer des poids pré-entraînés, en utilisant les connaissances d'un modèle existant pour améliorer les performances de ton propre modèle. Tu peux spécifier un ensemble de données, comme l'ensemble de données "fashion-mnist", qui est un ensemble bien connu d'images en niveaux de gris d'articles vestimentaires (chemises, pantalons, chaussures, etc.). L'entraînement du modèle sur cet ensemble de données lui apprend à reconnaître différentes catégories de vêtements. Tu peux remplacer "fashion-mnist" par n'importe quel ensemble de données correspondant à ton projet, comme les races de chats ou les types de plantes.
Bien que l'utilisation du paquet Ultralytics soit simple, elle nécessite une certaine connaissance de Python. Si tu cherches une option plus conviviale pour les débutants, tu peux utiliser le Ultralytics HUB, une plateforme conçue pour rendre la formation et le déploiement des différents modèles YOLO simples et accessibles. Pour commencer, tu devras créer un compte.
Une fois que tu es connecté, va dans la section "Modèles" et sélectionne le modèle YOLO11 pour la classification des images. Tu verras que plusieurs tailles de modèles sont disponibles : nano, petit, moyen, grand et très grand. Après avoir choisi un modèle, tu peux télécharger une image dans la section "Aperçu", où les prédictions apparaîtront sur le côté gauche de la page une fois que l'image aura été traitée.
YOLO11 offre de puissantes capacités de classification d'images qui ouvrent de nouvelles possibilités dans divers secteurs d'activité. Qu'il s'agisse d'améliorer la surveillance des cultures dans l'agriculture, la recherche de produits dans le commerce de détail ou la conservation de la faune et de la flore, la vitesse et la précision de YOLO11en font un outil idéal pour diverses applications. Avec des options de formation personnalisée grâce à l'offre Ultralytics Python ou une installation conviviale sans code sur Ultralytics HUB, les utilisateurs peuvent facilement incorporer YOLO11 dans leurs flux de travail. Alors que de plus en plus d'industries adoptent des solutions d'IA, YOLO11 offre un outil flexible et performant qui soutient l'innovation et les avancées pratiques.
Pour en explorer davantage, visite notre dépôt GitHub et engage-toi auprès de notre communauté. Explore les applications de l'IA dans les voitures auto-conduites et les soins de santé sur nos pages de solutions. 🚀
Commence ton voyage avec le futur de l'apprentissage automatique.