Glossaire

Segmentation d'images

Découvre la puissance de la segmentation des images avec Ultralytics YOLO . Explore la précision au niveau du pixel, les types, les applications et les cas d'utilisation de l'IA dans le monde réel.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

La segmentation d'image est une technique fondamentale de la vision par ordinateur (VA) qui consiste à diviser une image numérique en plusieurs régions ou segments distincts. L'objectif principal est d'attribuer une étiquette de classe à chaque pixel de l'image, en simplifiant essentiellement la représentation de l'image en quelque chose de plus significatif et de plus facile à analyser pour les machines. Contrairement à la détection d'objets, qui identifie les objets à l'aide de boîtes de délimitation rectangulaires, la segmentation d'images permet de comprendre le contenu de l'image de façon beaucoup plus granulaire, au niveau des pixels, en indiquant la forme exacte des objets. Cette précision est cruciale pour les tâches qui exigent une connaissance détaillée de l'espace.

Comment fonctionne la segmentation d'images

Les algorithmes de segmentation d'images examinent une image pixel par pixel et regroupent en segments les pixels qui partagent certaines caractéristiques, telles que la couleur, l'intensité, la texture ou l'emplacement spatial. Les premières méthodes s'appuyaient sur des techniques telles que le seuillage, la croissance des régions et le regroupement(K-Means, DBSCAN). Cependant, les approches modernes s'appuient fortement sur l'apprentissage profond (DL), en particulier les réseaux neuronaux convolutifs (CNN). Ces réseaux neuronaux apprennent des caractéristiques hiérarchiques complexes directement à partir des données d'entraînement pour effectuer une classification par pixel. Le résultat typique est un masque de segmentation, une image où la valeur de chaque pixel correspond à l'étiquette de classe à laquelle il appartient, mettant visuellement en évidence les limites précises des objets ou des régions. Des outils comme PyTorch et TensorFlow sont couramment utilisés pour construire et former ces modèles.

Types de segmentation d'images

Les tâches de segmentation d'images peuvent varier en fonction de la façon dont les objets et les classes sont traités :

  • Segmentation sémantique: Attribue chaque pixel à une catégorie prédéfinie (par exemple, "voiture", "route", "ciel"). Elle ne fait pas de distinction entre les différentes instances d'une même classe d'objets. Toutes les voitures, par exemple, partageraient la même étiquette.
  • Segmentation de l'instance: Va plus loin que la segmentation sémantique en identifiant et en délimitant chaque instance d'objet individuel dans une image. Chaque voiture distincte reçoit un identifiant ou un masque unique, même si elle appartient à la même classe. Ceci est particulièrement utile lorsqu'il est nécessaire de compter ou de suivre des objets individuels.
  • Segmentation panoptique: Combine la segmentation sémantique et la segmentation par instance. Elle attribue une étiquette de classe à chaque pixel (comme la segmentation sémantique) et identifie de façon unique chaque instance d'objet (comme la segmentation d'instance). Elle permet d'obtenir une compréhension globale et unifiée de la scène.

Distinguer la segmentation d'images des termes apparentés

  • Segmentation d'images et détection d'objets: La détection d'objets dessine des boîtes de délimitation autour des objets, indiquant leur emplacement et leur classe. La segmentation d'image fournit un masque au niveau des pixels décrivant la forme exacte de chaque objet ou région, offrant plus de détails qu'une simple boîte.
  • Segmentation et classification des images: La classification des images attribue une seule étiquette à l'ensemble de l'image (par exemple, "contient un chat"). La segmentation d'image attribue une étiquette à chaque pixel de l'image, identifiant ainsi plusieurs objets ou régions et leurs formes.
  • Segmentation d'images et reconnaissance d'images: La reconnaissance d'images est un terme plus large qui désigne les tâches dans lesquelles l'IA identifie des objets, des personnes, des lieux, etc. dans des images. La segmentation d'images est un type spécifique de reconnaissance d'images qui se concentre sur le partitionnement au niveau des pixels.

Applications dans le monde réel

L'analyse détaillée fournie par la segmentation d'images permet de nombreuses applications :

Segmentation d'images et Ultralytics YOLO

Ultralytics YOLO tels que YOLOv8 et YOLO11Les modèles YOLO, tels que YOLOv8 et YOLO11, offrent des performances de pointe pour les tâches de segmentation d'instances, en équilibrant la vitesse et la précision pour l'inférence en temps réel. Le cadre Ultralytics simplifie le processus de formation de modèles de segmentation personnalisés sur des ensembles de données tels que COCO ou des ensembles de données spécialisés tels que les pièces de voiture ou la segmentation des fissures. Des outils comme Ultralytics HUB offrent une plateforme rationalisée pour gérer les ensembles de données, former les modèles(formation dans le nuage disponible) et les déployer. Tu peux explorer la documentation sur les tâches de segmentation pour obtenir des détails sur la mise en œuvre ou suivre des guides comme la segmentation avec des modèles YOLOv8 pré-entraînés ou la segmentation d'images avec YOLO11 sur Google Colab.

Tout lire