Glossaire

Classification des images

Découvre la classification des images avec Ultralytics YOLO : forme des modèles personnalisés pour la santé, l'agriculture, le commerce de détail, et plus encore, en utilisant des outils de pointe.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

La classification des images est une tâche fondamentale de la vision par ordinateur (VA) qui consiste à attribuer une étiquette ou une catégorie unique à l'ensemble d'une image en fonction de son contenu visuel. Il s'agit d'une capacité essentielle de l'intelligence artificielle (IA), qui permet aux machines de comprendre et de catégoriser les images de manière similaire à la façon dont les humains reconnaissent les scènes ou les objets. Alimentée par des techniques de Machine Learning (ML) et plus particulièrement de Deep Learning (DL), la classification d'images vise à répondre à la question suivante : "Quel est le sujet principal de cette image ?".

Comment fonctionne la classification des images

Le processus consiste généralement à former un modèle, souvent un type spécialisé de réseau neuronal appelé réseau neuronal convolutif (CNN), sur un grand ensemble de données d'images étiquetées. Des ensembles de données célèbres comme ImageNet contiennent des millions d'images classées en milliers de classes. Au cours de la formation, le modèle apprend à identifier les modèles et les caractéristiques, tels que les textures, les formes et les distributions de couleurs, qui permettent de distinguer les différentes catégories. Des outils comme PyTorch et TensorFlow fournissent les outils nécessaires à la construction et à l'entraînement de ces modèles. Tu peux explorer divers ensembles de données de classificationUltralytics pour démarrer tes propres projets. L'objectif est que le modèle entraîné prédise avec précision l'étiquette de la classe pour de nouvelles images inédites. Pour une compréhension technique plus approfondie, des ressources telles que le cours CS231n de Stanford offrent une documentation complète sur les CNN.

Principales différences avec les autres tâches

La classification d'images se concentre sur l'attribution d'une seule étiquette à l'image entière. C'est ce qui la distingue des autres tâches courantes de CV :

  • Détection d'objets: Identifie plusieurs objets dans une image et localise chacun d'eux à l'aide de boîtes de délimitation. Elle répond à la question "Quels sont les objets présents sur l'image et où sont-ils ?".
  • Segmentation des instances: Va plus loin que la détection des objets en définissant les limites exactes des pixels de chaque instance d'objet distincte.
  • Segmentation sémantique: Classe chaque pixel de l'image dans un ensemble de catégories prédéfinies (par exemple, "ciel", "route", "voiture"), mais ne fait pas la différence entre les instances individuelles de la même catégorie.

Il est essentiel de comprendre ces différences pour choisir la technique appropriée à un problème donné.

Applications dans le monde réel

La classification des images est largement utilisée dans divers domaines en raison de sa relative simplicité et de son efficacité :

Classification d'images avec Ultralytics

Les modèles Ultralytics YOLO , réputés pour la détection d'objets, excellent également dans les tâches de classification d'images. Les architectures modernes comme Ultralytics YOLOv11 peuvent être facilement entraînées à la classification à l'aide du packageUltralytics Python ou de la plateforme sans code Ultralytics HUB. Ces outils fournissent des ressources complètes, notamment des conseils pour l'entraînement des modèles et une documentation claire comme le guide sur l'utilisation d'Ultralytics YOLOv11 pour la classification d'images. Pour t'entraîner, pense à explorer les tutoriels de classificationPyTorch ou à participer aux concours de classification d'images Kaggle. Reste au courant des dernières avancées de la recherche grâce à des ressources telles que Papers With Code.

Tout lire