Découvre la classification des images avec Ultralytics YOLO : forme des modèles personnalisés pour la santé, l'agriculture, le commerce de détail, et plus encore, en utilisant des outils de pointe.
La classification des images est une tâche fondamentale de la vision par ordinateur (VA) qui consiste à attribuer une étiquette ou une catégorie unique à l'ensemble d'une image en fonction de son contenu visuel. Il s'agit d'une capacité essentielle de l'intelligence artificielle (IA), qui permet aux machines de comprendre et de catégoriser les images de manière similaire à la façon dont les humains reconnaissent les scènes ou les objets. Alimentée par des techniques de Machine Learning (ML) et plus particulièrement de Deep Learning (DL), la classification d'images vise à répondre à la question suivante : "Quel est le sujet principal de cette image ?". Cette tâche sert de pierre angulaire à de nombreux problèmes de compréhension visuelle plus complexes.
La classification des images se concentre sur l'attribution d'une étiquette unique et globale à l'ensemble de l'image. C'est ce qui la distingue des autres tâches courantes de vision par ordinateur:
Il est essentiel de comprendre ces différences pour choisir la technique appropriée à un problème spécifique, car chaque tâche fournit un niveau de détail différent sur le contenu de l'image.
La classification des images est largement utilisée dans divers domaines en raison de son efficacité à catégoriser les informations visuelles :
Les modèlesYOLO d'Ultralytics , bien que réputés pour la détection d'objets, font également preuve de solides performances dans les tâches de classification d'images. Les architectures de pointe comme Ultralytics YOLO11 peuvent être facilement entraînées ou affinées pour la classification à l'aide du package intuitif Ultralytics Python ou de la plateforme sans code Ultralytics HUB. Ces outils fournissent des ressources complètes, notamment des conseils pour l'entraînement des modèles et une documentation claire, comme le guide sur l'utilisation d'Ultralytics YOLO11 pour la classification d'images. Pour t'entraîner davantage, pense à explorer les tutoriels de classificationPyTorch ou à participer aux concours de classification d'images Kaggle. Pour rester au courant des dernières avancées de la recherche, des ressources comme Papers With Code sont inestimables. Tu peux aussi comparer les performances du modèle YOLO sur des benchmarks standards.
Comment fonctionne la classification des images
Le processus consiste généralement à former un modèle, souvent un type spécialisé de réseau neuronal appelé réseau neuronal convolutif (CNN), sur un grand ensemble de données d'images étiquetées. Des ensembles de données célèbres comme ImageNet, qui contient des millions d'images dans des milliers de catégories, sont couramment utilisés pour former des modèles robustes. Au cours de la formation, le modèle apprend à identifier les modèles et les caractéristiques distinctifs, tels que les textures, les formes, les bords et les distributions de couleurs, qui caractérisent les différentes catégories. Des outils tels que PyTorch et TensorFlow fournissent les outils et les bibliothèques nécessaires pour construire et entraîner ces modèles d'apprentissage profond. Tu peux explorer divers ensembles de données de classificationUltralytics comme CIFAR-100 ou MNIST pour démarrer tes propres projets. L'objectif final est que le modèle entraîné prédise avec précision l'étiquette de classe pour de nouvelles images jamais vues auparavant. Pour une compréhension technique plus approfondie des mécanismes sous-jacents, des ressources telles que le cours Stanford CS231n sur les réseaux neuronaux convolutifs pour la reconnaissance visuelle offrent un matériel complet.