Découvre comment la segmentation des instances affine la détection des objets avec une précision au niveau du pixel, ce qui permet d'obtenir des masques d'objets détaillés pour les applications d'IA.
La segmentation d'instance est une technique sophistiquée de vision par ordinateur (VA) qui identifie les objets dans une image et délimite les frontières précises de chaque instance individuelle au niveau du pixel. Contrairement aux méthodes qui se contentent de placer des boîtes autour des objets, la segmentation d'instance permet d'obtenir une compréhension beaucoup plus détaillée d'une scène en créant un masque unique pour chaque objet détecté, même s'ils appartiennent à la même classe. Cette capacité est cruciale pour les applications avancées d'intelligence artificielle (IA) où il est essentiel de connaître la forme, la taille et l'étendue spatiale exactes d'objets distincts, en particulier lorsque les objets se chevauchent.
Il est important de différencier la segmentation des instances des autres tâches de segmentation des images:
La segmentation des instances se concentre spécifiquement sur la détection et la délimitation des instances d'objets individuels, ce qui permet d'obtenir une grande précision en ce qui concerne les limites et la séparation des objets.
La capacité d'identifier et d'isoler précisément des objets individuels rend la segmentation des instances inestimable dans de nombreux domaines :
Ultralytics fournit des modèles de pointe capables d'effectuer une segmentation efficace des instances. Des modèles comme YOLOv8 et YOLO11 sont conçus pour offrir des performances élevées dans diverses tâches de vision par ordinateur, y compris la segmentation d'instances(voir les détails de la tâche de segmentation). Les utilisateurs peuvent exploiter des modèles pré-entraînés ou effectuer un réglage fin sur des ensembles de données personnalisés à l'aide d'outils tels que la plateforme Ultralytics HUB, qui simplifie le flux de travail de l'apprentissage machine (ML), de la gestion des données au déploiement des modèles. Pour une mise en œuvre pratique, des ressources telles que des tutoriels sur la segmentation avec des modèles Ultralytics YOLOv8 pré-entraînés ou des guides sur l'isolation des objets de segmentation sont disponibles. Tu peux également apprendre à utiliser Ultralytics YOLO11 pour la segmentation des instances. Des frameworks populaires comme PyTorch et TensorFlow sont couramment utilisés pour développer et déployer ces modèles.
Comment fonctionne la segmentation des instances
Les modèles de segmentation d'instance analysent une image pour localiser d'abord les objets potentiels puis, pour chaque objet détecté, prédire quels pixels appartiennent à cette instance spécifique. Les approches traditionnelles, comme l'architecture R-CNN à masque influent, utilisent souvent un processus en deux étapes : premièrement, elles effectuent une détection d'objet pour générer des propositions de boîtes de délimitation, et deuxièmement, elles génèrent un masque de segmentation à l'intérieur de chaque boîte proposée. Bien qu'efficaces, ces méthodes peuvent être exigeantes en termes de calcul.
Des approches plus récentes, y compris des modèles comme Ultralytics YOLOutilisent souvent des pipelines en une seule étape. Ces modèles prédisent simultanément les boîtes de délimitation, les étiquettes de classe et les masques d'instance en un seul passage dans le réseau neuronal (NN), ce qui entraîne des améliorations significatives de la vitesse et les rend adaptés à l'inférence en temps réel. L'entraînement de ces modèles nécessite de grands ensembles de données avec des annotations au niveau du pixel, comme l'ensemble de données COCO largement utilisé, et plus précisément ses annotations de segmentation. Le processus fait généralement appel à des techniques d'apprentissage profond (DL), tirant parti des réseaux neuronaux convolutifs (CNN) pour apprendre des caractéristiques visuelles complexes.