Découvre comment la segmentation des instances affine la détection des objets avec une précision au niveau du pixel, ce qui permet d'obtenir des masques d'objets détaillés pour les applications d'IA.
La segmentation des instances est une technique sophistiquée de vision par ordinateur qui identifie les objets dans une image et délimite les frontières précises de chaque instance individuelle au niveau du pixel. Cela permet d'obtenir une compréhension beaucoup plus détaillée d'une scène que si l'on se contente de dessiner des boîtes autour des objets, ce qui permet d'utiliser des applications avancées d'intelligence artificielle (IA) où la forme et la séparation exactes sont cruciales.
Allant au-delà des méthodes plus simples, la segmentation par instance génère un masque unique pour chaque objet détecté, même si plusieurs objets appartiennent à la même catégorie (comme l'identification séparée de chaque voiture sur une photo de circulation). Ce contour parfait au pixel près permet aux systèmes de comprendre non seulement quels objets sont présents, mais aussi leur forme, leur taille et leur emplacement exacts, en distinguant efficacement les éléments qui se chevauchent. Cette capacité est vitale pour les tâches nécessitant une conscience spatiale précise et une grande exactitude.
Il est important de distinguer la segmentation des instances des tâches connexes de vision par ordinateur:
La segmentation des instances se concentre spécifiquement sur l'identification et la délimitation d'objets distincts.
Le résultat détaillé de la segmentation des instances est inestimable dans de nombreux domaines :
Ultralytics fournit des modèles de pointe capables d'effectuer une segmentation d'instance très performante. Des modèles comme Ultralytics YOLOv8 et le plus récent Ultralytics YOLO11 offrent des poids pré-entraînés pour les tâches de segmentation et peuvent être facilement entraînés sur des ensembles de données spécifiques. Tu peux apprendre à utiliser YOLO11 pour la segmentation d'instances ou explorer la segmentation avec des modèles YOLOv8 pré-entraînés. La gestion des ensembles de données, la formation et le déploiement sont simplifiés grâce à Ultralytics HUB. Pour une comparaison détaillée des performances, voir YOLO11 vs YOLOv8. La documentation sur la tâche de segmentation fournit des conseils supplémentaires.
Comment fonctionne la segmentation des instances
Les approches traditionnelles, comme le célèbre R-CNN des masques, utilisent souvent un processus en deux étapes : d'abord la détection d'objets avec des boîtes de délimitation, puis la génération de masques à l'intérieur de ces boîtes. Bien que précise, cette méthode peut être très gourmande en ressources informatiques. Les méthodes plus modernes à une seule étape, y compris les variantes de la méthode Ultralytics YOLOprédisent simultanément les boîtes de délimitation et les masques, ce qui permet d'obtenir des performances plus rapides, adaptées à l'inférence en temps réel. Ces modèles sont entraînés sur de grands ensembles de données comme COCO, qui comprennent des annotations de segmentation(COCO Segmentation Dataset).