Segmentation d'images

Découvrez la puissance de la segmentation d'images avec Ultralytics YOLO. Explorez la précision au niveau du pixel, les types, les applications et les cas d'utilisation de l'IA dans le monde réel.

La segmentation d'images est une tâche fondamentale de la vision par ordinateur qui consiste à diviser une image numérique en plusieurs régions ou segments distincts. L'objectif est d'attribuer une étiquette spécifique à chaque pixel d'une image, créant ainsi une carte des objets et de l'arrière-plan au niveau du pixel. Contrairement à d'autres tâches de CV qui permettent d'identifier l'emplacement d'un objet à l'aide d'une simple boîte, la segmentation d'image fournit une compréhension beaucoup plus détaillée en soulignant la forme précise de chaque objet. Ce détail granulaire est crucial pour les applications qui nécessitent une compréhension approfondie de la géométrie et de la composition de la scène. Ce processus est à la base de nombreuses applications avancées d'intelligence artificielle.

Types de segmentation d'images

La segmentation des images peut être classée en trois catégories principales, chacune offrant un niveau de détail différent et répondant à des objectifs distincts :

Segmentation sémantique: Cette technique permet de classer chaque pixel d'une image dans une catégorie prédéfinie, telle que "voiture", "route" ou "ciel". Toutes les instances d'une même classe d'objets sont regroupées sous une seule étiquette. Par exemple, dans une image comportant plusieurs voitures, la segmentation sémantique étiquetterait tous les pixels appartenant à une voiture comme étant simplement "voiture", sans distinguer une voiture d'une autre.
Segmentation par instance: Cette méthode pousse la segmentation un peu plus loin, non seulement en classant chaque pixel, mais aussi en différenciant les instances individuelles d'une même classe. Dans la même scène de rue, la segmentation par instance identifierait chaque voiture comme un objet unique, en attribuant un masque distinct à la "voiture 1", à la "voiture 2", etc. Cette méthode est particulièrement utile lorsqu'il est nécessaire de compter ou de suivre des objets individuels.
Segmentation panoptique: En tant qu'approche hybride, la segmentation panoptique combine les forces de la segmentation sémantique et de la segmentation d'instance. Elle vise à créer une compréhension complète et unifiée d'une scène en attribuant une étiquette de classe à chaque pixel (comme la segmentation sémantique) tout en identifiant de manière unique chaque instance d'objet (comme la segmentation d'instance). Cela permet d'obtenir l'analyse de scène la plus complète qui soit.

En quoi la segmentation d'images diffère-t-elle des autres tâches CV ?

Il est important de distinguer la segmentation d'images des autres tâches courantes de vision par ordinateur :

Classification d'images: Elle se concentre sur l'attribution d'une étiquette unique à l'ensemble d'une image (par exemple, "c'est une photo de plage"). Elle comprend ce qui se trouve dans l'image, mais pas où.
Détection d'objets: Identifie et localise les objets dans une image, généralement en dessinant un cadre autour d'eux. Elle indique les objets présents et leur emplacement approximatif, mais pas leur forme exacte.
Segmentation d'images : Elle fournit le plus de détails en définissant les limites exactes de chaque objet au niveau du pixel, ce qui permet de comprendre avec précision la forme et l'emplacement de l'objet.

Applications et cas d'utilisation

Les résultats détaillés de la segmentation d'images la rendent inestimable dans de nombreux domaines.

Véhicules autonomes: Pour que les voitures autonomes puissent naviguer en toute sécurité, elles ont besoin d'une compréhension précise de leur environnement. Les modèles de segmentation identifient les limites exactes de la route, des voies, des piétons, des autres véhicules et des obstacles, ce qui permet de mieux planifier la trajectoire et de prendre de meilleures décisions. Vous pouvez en savoir plus sur le rôle de l'IA dans l'industrie automobile.
Analyse d'images médicales: Dans le domaine de la santé, la segmentation est utilisée pour analyser des images médicales telles que l'IRM ou la tomodensitométrie. Elle permet de délimiter avec précision les tumeurs, les organes ou les anomalies, ce qui aide les médecins à établir un diagnostic précis, à planifier les interventions chirurgicales et à suivre l'évolution de la maladie. Il s'agit d'une application clé pour des architectures comme U-Net, qui excelle dans les contextes biomédicaux.
Analyse d'images satellites: Les modèles de segmentation traitent l'imagerie satellitaire pour surveiller les changements environnementaux, tels que la déforestation ou l'urbanisation. Ils peuvent classer l'occupation des sols (forêts, eaux, zones urbaines) et détecter des objets individuels tels que des bâtiments ou des navires pour la cartographie et la collecte de renseignements.
Fabrication et robotique: Dans les usines automatisées, la segmentation aide les robots à identifier des pièces spécifiques sur un tapis roulant en vue de leur assemblage ou à effectuer un contrôle de qualité en détectant les défauts avec une grande précision. Vous pouvez en savoir plus sur son utilisation dans la segmentation des fissures.