Glossaire

Segmentation des instances

Découvre comment la segmentation des instances affine la détection des objets avec une précision au niveau du pixel, ce qui permet d'obtenir des masques d'objets détaillés pour les applications d'IA.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

La segmentation d'instance est une technique sophistiquée de vision par ordinateur (VA) qui identifie les objets dans une image et délimite les frontières précises de chaque instance individuelle au niveau du pixel. Contrairement aux méthodes qui se contentent de placer des boîtes autour des objets, la segmentation d'instance permet d'obtenir une compréhension beaucoup plus détaillée d'une scène en créant un masque unique pour chaque objet détecté, même s'ils appartiennent à la même classe. Cette capacité est cruciale pour les applications avancées d'intelligence artificielle (IA) où il est essentiel de connaître la forme, la taille et l'étendue spatiale exactes d'objets distincts, en particulier lorsque les objets se chevauchent.

Comment fonctionne la segmentation des instances

Les modèles de segmentation d'instance analysent une image pour localiser d'abord les objets potentiels puis, pour chaque objet détecté, prédire quels pixels appartiennent à cette instance spécifique. Les approches traditionnelles, comme l'architecture R-CNN à masque influent, utilisent souvent un processus en deux étapes : premièrement, elles effectuent une détection d'objet pour générer des propositions de boîtes de délimitation, et deuxièmement, elles génèrent un masque de segmentation à l'intérieur de chaque boîte proposée. Bien qu'efficaces, ces méthodes peuvent être exigeantes en termes de calcul.

Des approches plus récentes, y compris des modèles comme Ultralytics YOLOutilisent souvent des pipelines en une seule étape. Ces modèles prédisent simultanément les boîtes de délimitation, les étiquettes de classe et les masques d'instance en un seul passage dans le réseau neuronal (NN), ce qui entraîne des améliorations significatives de la vitesse et les rend adaptés à l'inférence en temps réel. L'entraînement de ces modèles nécessite de grands ensembles de données avec des annotations au niveau du pixel, comme l'ensemble de données COCO largement utilisé, et plus précisément ses annotations de segmentation. Le processus fait généralement appel à des techniques d'apprentissage profond (DL), tirant parti des réseaux neuronaux convolutifs (CNN) pour apprendre des caractéristiques visuelles complexes.

Segmentation des instances et tâches connexes

Il est important de différencier la segmentation des instances des autres tâches de segmentation des images:

  • Détection d'objets: Identifie la présence et l'emplacement des objets à l'aide de boîtes de délimitation, mais ne fournit pas d'informations sur la forme. La segmentation des instances va plus loin en délimitant les pixels exacts de chaque objet.
  • Segmentation sémantique: Attribue une étiquette de classe à chaque pixel d'une image (par exemple, "voiture", "personne", "route"). Cependant, elle ne fait pas la distinction entre les différentes instances d'une même classe. Toutes les voitures, par exemple, feraient partie du même segment "voiture". Tu peux en savoir plus dans ce guide sur la segmentation par instance et la segmentation sémantique.
  • Segmentation panoptique: Combine la segmentation sémantique et la segmentation par instance. Elle attribue une étiquette de classe à chaque pixel (comme la segmentation sémantique) et identifie également de façon unique chaque instance d'objet (comme la segmentation d'instance).

La segmentation des instances se concentre spécifiquement sur la détection et la délimitation des instances d'objets individuels, ce qui permet d'obtenir une grande précision en ce qui concerne les limites et la séparation des objets.

Applications de la segmentation des instances

La capacité d'identifier et d'isoler précisément des objets individuels rend la segmentation des instances inestimable dans de nombreux domaines :

  • Conduite autonome: Les voitures à conduite autonome s'appuient sur la segmentation des instances pour percevoir avec précision leur environnement. Faire la différence entre les véhicules individuels, les piétons, les cyclistes et les obstacles, même dans des scènes encombrées ou qui se chevauchent, est essentiel pour une navigation et une prise de décision sûres. Des entreprises comme Waymo ont largement recours à ces techniques.
  • Analyse d'images médicales: En radiologie et en pathologie, la segmentation des instances permet de mettre en évidence des structures spécifiques telles que des tumeurs, des organes ou des cellules dans les scanners(CT, IRM, etc.). Cette précision au niveau du pixel facilite le diagnostic, la mesure de la taille des tumeurs, la planification des opérations chirurgicales et le suivi de l'évolution de la maladie. Par exemple, l 'utilisation de YOLO11 pour la détection des tumeurs illustre cette application dans le contexte plus large de l'IA dans le domaine de la santé.
  • Robotique: Les robots qui effectuent des tâches telles que la saisie ou la manipulation dans des environnements non structurés ont besoin d'identifier et de localiser précisément des objets individuels. La segmentation des instances permet aux robots de comprendre la forme et les limites exactes des objets pour une interaction réussie, ce qui est étudié plus en détail dans AI in Robotics.
  • Analyse d'images satellites: Utilisée pour la cartographie détaillée de la couverture terrestre, la surveillance de l'étalement urbain par l'identification de bâtiments individuels, ou le suivi d'objets spécifiques tels que des navires ou des véhicules. Ce niveau de détail permet la surveillance de l'environnement, la gestion des ressources et la collecte de renseignements. Explore les techniques générales d'analyse d'images satellites.
  • Surveillance agricole: Aide à compter les plantes ou les fruits individuels, à évaluer la santé des cultures par plante, ou à identifier des types spécifiques de mauvaises herbes pour une intervention ciblée, contribuant ainsi à l'agriculture de précision.

Segmentation des instances avec Ultralytics YOLO

Ultralytics fournit des modèles de pointe capables d'effectuer une segmentation efficace des instances. Des modèles comme YOLOv8 et YOLO11 sont conçus pour offrir des performances élevées dans diverses tâches de vision par ordinateur, y compris la segmentation d'instances(voir les détails de la tâche de segmentation). Les utilisateurs peuvent exploiter des modèles pré-entraînés ou effectuer un réglage fin sur des ensembles de données personnalisés à l'aide d'outils tels que la plateforme Ultralytics HUB, qui simplifie le flux de travail de l'apprentissage machine (ML), de la gestion des données au déploiement des modèles. Pour une mise en œuvre pratique, des ressources telles que des tutoriels sur la segmentation avec des modèles Ultralytics YOLOv8 pré-entraînés ou des guides sur l'isolation des objets de segmentation sont disponibles. Tu peux également apprendre à utiliser Ultralytics YOLO11 pour la segmentation des instances. Des frameworks populaires comme PyTorch et TensorFlow sont couramment utilisés pour développer et déployer ces modèles.

Tout lire