Glossaire

Classification des images

Découvre la classification des images avec Ultralytics YOLO : forme des modèles personnalisés pour la santé, l'agriculture, le commerce de détail, et plus encore, en utilisant des outils de pointe.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

La classification des images est une tâche fondamentale de la vision par ordinateur (VA) qui consiste à attribuer une étiquette ou une catégorie unique à l'ensemble d'une image en fonction de son contenu visuel. Il s'agit d'une capacité essentielle de l'intelligence artificielle (IA), qui permet aux machines de comprendre et de catégoriser les images de manière similaire à la façon dont les humains reconnaissent les scènes ou les objets. Alimentée par des techniques de Machine Learning (ML) et plus particulièrement de Deep Learning (DL), la classification d'images vise à répondre à la question suivante : "Quel est le sujet principal de cette image ?". Cette tâche sert de pierre angulaire à de nombreux problèmes de compréhension visuelle plus complexes.

Comment fonctionne la classification des images

Le processus consiste généralement à former un modèle, souvent un type spécialisé de réseau neuronal appelé réseau neuronal convolutif (CNN), sur un grand ensemble de données d'images étiquetées. Des ensembles de données célèbres comme ImageNet, qui contient des millions d'images dans des milliers de catégories, sont couramment utilisés pour former des modèles robustes. Au cours de la formation, le modèle apprend à identifier les modèles et les caractéristiques distinctifs, tels que les textures, les formes, les bords et les distributions de couleurs, qui caractérisent les différentes catégories. Des outils tels que PyTorch et TensorFlow fournissent les outils et les bibliothèques nécessaires pour construire et entraîner ces modèles d'apprentissage profond. Tu peux explorer divers ensembles de données de classificationUltralytics comme CIFAR-100 ou MNIST pour démarrer tes propres projets. L'objectif final est que le modèle entraîné prédise avec précision l'étiquette de classe pour de nouvelles images jamais vues auparavant. Pour une compréhension technique plus approfondie des mécanismes sous-jacents, des ressources telles que le cours Stanford CS231n sur les réseaux neuronaux convolutifs pour la reconnaissance visuelle offrent un matériel complet.

Principales différences par rapport aux autres tâches de vision

La classification des images se concentre sur l'attribution d'une étiquette unique et globale à l'ensemble de l'image. C'est ce qui la distingue des autres tâches courantes de vision par ordinateur:

  • Détection d'objets: Cette tâche va plus loin en ne se contentant pas de classer les objets dans une image mais en les localisant, généralement en dessinant des boîtes de délimitation autour de chaque instance détectée. Elle répond à la question "Quels sont les objets présents sur cette image et où sont-ils situés ?".
  • Segmentation d'images: Il s'agit de classer chaque pixel de l'image.
    • Segmentation sémantique attribue une étiquette de classe (par exemple, "voiture", "route", "ciel") à chaque pixel, sans faire de distinction entre les différentes instances de la même classe.
    • Segmentation par instance distingue les instances individuelles d'objets, en attribuant un identifiant unique aux pixels appartenant à chaque objet séparé (par exemple, en étiquetant "voiture 1", "voiture 2").

Il est essentiel de comprendre ces différences pour choisir la technique appropriée à un problème spécifique, car chaque tâche fournit un niveau de détail différent sur le contenu de l'image.

Applications dans le monde réel

La classification des images est largement utilisée dans divers domaines en raison de son efficacité à catégoriser les informations visuelles :

Classification d'images avec Ultralytics

Les modèlesYOLO d'Ultralytics , bien que réputés pour la détection d'objets, font également preuve de solides performances dans les tâches de classification d'images. Les architectures de pointe comme Ultralytics YOLO11 peuvent être facilement entraînées ou affinées pour la classification à l'aide du package intuitif Ultralytics Python ou de la plateforme sans code Ultralytics HUB. Ces outils fournissent des ressources complètes, notamment des conseils pour l'entraînement des modèles et une documentation claire, comme le guide sur l'utilisation d'Ultralytics YOLO11 pour la classification d'images. Pour t'entraîner davantage, pense à explorer les tutoriels de classificationPyTorch ou à participer aux concours de classification d'images Kaggle. Pour rester au courant des dernières avancées de la recherche, des ressources comme Papers With Code sont inestimables. Tu peux aussi comparer les performances du modèle YOLO sur des benchmarks standards.

Tout lire