Découvre la classification des images avec Ultralytics YOLO : forme des modèles personnalisés pour la santé, l'agriculture, le commerce de détail, et plus encore, en utilisant des outils de pointe.
La classification des images est une tâche fondamentale de la vision par ordinateur (VA) qui consiste à attribuer une étiquette ou une catégorie unique à l'ensemble d'une image en fonction de son contenu visuel. Il s'agit d'une capacité essentielle de l'intelligence artificielle (IA), qui permet aux machines de comprendre et de catégoriser les images de manière similaire à la façon dont les humains reconnaissent les scènes ou les objets. Alimentée par des techniques de Machine Learning (ML) et plus particulièrement de Deep Learning (DL), la classification d'images vise à répondre à la question suivante : "Quel est le sujet principal de cette image ?".
La classification d'images se concentre sur l'attribution d'une seule étiquette à l'image entière. C'est ce qui la distingue des autres tâches courantes de CV :
Il est essentiel de comprendre ces différences pour choisir la technique appropriée à un problème donné.
La classification des images est largement utilisée dans divers domaines en raison de sa relative simplicité et de son efficacité :
Les modèles Ultralytics YOLO , réputés pour la détection d'objets, excellent également dans les tâches de classification d'images. Les architectures modernes comme Ultralytics YOLOv11 peuvent être facilement entraînées à la classification à l'aide du packageUltralytics Python ou de la plateforme sans code Ultralytics HUB. Ces outils fournissent des ressources complètes, notamment des conseils pour l'entraînement des modèles et une documentation claire comme le guide sur l'utilisation d'Ultralytics YOLOv11 pour la classification d'images. Pour t'entraîner, pense à explorer les tutoriels de classificationPyTorch ou à participer aux concours de classification d'images Kaggle. Reste au courant des dernières avancées de la recherche grâce à des ressources telles que Papers With Code.
Comment fonctionne la classification des images
Le processus consiste généralement à former un modèle, souvent un type spécialisé de réseau neuronal appelé réseau neuronal convolutif (CNN), sur un grand ensemble de données d'images étiquetées. Des ensembles de données célèbres comme ImageNet contiennent des millions d'images classées en milliers de classes. Au cours de la formation, le modèle apprend à identifier les modèles et les caractéristiques, tels que les textures, les formes et les distributions de couleurs, qui permettent de distinguer les différentes catégories. Des outils comme PyTorch et TensorFlow fournissent les outils nécessaires à la construction et à l'entraînement de ces modèles. Tu peux explorer divers ensembles de données de classificationUltralytics pour démarrer tes propres projets. L'objectif est que le modèle entraîné prédise avec précision l'étiquette de la classe pour de nouvelles images inédites. Pour une compréhension technique plus approfondie, des ressources telles que le cours CS231n de Stanford offrent une documentation complète sur les CNN.