Boîte de délimitation

Découvrez comment les boîtes englobantes permettent la détection d'objets, l'IA et les systèmes d'apprentissage automatique. Explorez leur rôle dans les applications de vision par ordinateur !

Une boîte de délimitation est une annotation rectangulaire utilisée en vision artificielle pour indiquer l'emplacement d'un objet dans une image ou une trame vidéo. Il s'agit d'un élément fondamental de la détection d'objets, qui offre un moyen simple mais efficace de définir la position et l'échelle d'un objet. Dans le cadre de l'apprentissage automatique, des modèles sont formés sur de vastes ensembles d' images avec des boîtes englobantes étiquetées afin d'apprendre à identifier et à localiser des objets de manière autonome. Les résultats de ces modèles comprennent les coordonnées de la boîte, une étiquette de classe (par exemple, "voiture", "personne") et un score de confiance indiquant la certitude du modèle dans sa prédiction.

Fonctionnement des cadres de délimitation

Une boîte de délimitation est généralement définie par un ensemble de coordonnées qui spécifient sa position et sa taille. Les représentations les plus courantes sont les suivantes

Coordonnées du coin supérieur gauche avec largeur et hauteur (x, y, w, h): Ce format spécifie les coordonnées x et y du coin supérieur gauche, ainsi que la largeur et la hauteur de la boîte.
Points d'angle (x_min, y_min, x_max, y_max): Ce format définit les coordonnées des coins supérieur gauche et inférieur droit du rectangle.

Ces coordonnées sont utilisées pour former des modèles d'apprentissage profond, qui apprennent à prédire ces valeurs pour de nouvelles images inédites. La précision d'une boîte de délimitation prédite est souvent évaluée à l'aide d'une métrique appelée Intersection over Union (IoU), qui mesure le chevauchement entre la boîte prédite et la boîte de vérité au sol. Les modèles modernes de détection d'objets, tels qu'Ultralytics YOLO11, sont hautement optimisés pour générer des boîtes de délimitation précises en temps réel.

Types de cadres de délimitation

Il existe deux types principaux de boîtes de délimitation :

Boîte de délimitation alignée sur les axes: Il s'agit du type le plus courant, dans lequel les côtés du rectangle sont alignés sur les axes horizontal et vertical de l'image. Elles sont simples à représenter et à traiter, mais peuvent s'avérer inefficaces pour les objets tournés ou de forme irrégulière, car la boîte peut inclure une zone d'arrière-plan importante.
Boîte de délimitation orientée (OBB): Ce type de boîte comprend un paramètre supplémentaire pour la rotation, ce qui lui permet de mieux s'adapter aux objets inclinés. Les OBB sont particulièrement utiles dans des applications spécialisées telles que l'analyse d'images satellites ou l'imagerie aérienne par drones, où les objets sont souvent observés sous différents angles. Des modèles comme YOLO11 prennent en charge la détection orientée d'objets afin de gérer ces scénarios de manière plus efficace.

Relations avec d'autres concepts

Les boîtes englobantes sont étroitement liées à d'autres tâches de vision par ordinateur, mais elles ont un objectif distinct.

Détection d'objets et segmentation d'images: Alors que la détection d'objets utilise des boîtes de délimitation pour localiser les objets, la segmentation d'images offre une compréhension plus détaillée de la forme d'un objet. La segmentation d'instance, par exemple, va plus loin en définissant les limites exactes au niveau des pixels de chaque objet distinct, au lieu de simplement dessiner un rectangle autour de l'objet. Ceci est utile pour les applications nécessitant des informations précises sur la forme. Vous trouverez de plus amples informations dans ce guide sur la segmentation d'instance.
Boîte de délimitation et boîte d'ancrage: Dans certains modèles de détection d'objets, connus sous le nom de détecteurs basés sur les ancres, des boîtes prédéfinies appelées "boîtes d'ancrage" sont utilisées comme références pour aider le modèle à prédire la boîte d'encombrement finale. En revanche, les détecteurs sans ancrage prédisent les boîtes d'encombrement directement sans ces boîtes prédéfinies, ce qui simplifie souvent l'architecture du modèle.

Applications dans le monde réel

Les boîtes englobantes font partie intégrante de nombreuses applications pratiques de l'intelligence artificielle :

Véhicules autonomes: Les voitures autonomes s'appuient fortement sur la détection d'objets pour identifier et localiser les piétons, les autres véhicules et les feux de signalisation à l'aide de boîtes englobantes. Cette connaissance de l'espace, souvent obtenue grâce à des modèles d'apprentissage profond, est essentielle pour une navigation sûre. Des entreprises comme Waymo présentent cette technologie de manière extensive. Ultralytics offre un aperçu de l'IA dans les voitures auto-conduites.
Analyse du commerce de détail: Dans le commerce de détail, les boîtes englobantes contribuent à la gestion des stocks pilotée par l'IA en détectant les produits sur les étagères, en contrôlant les niveaux de stock et en analysant le comportement des clients à travers les schémas de circulation(comptage d'objets).
Sécurité et surveillance: Les boîtes de délimitation permettent aux systèmes de surveillance automatisés de détecter et de suivre des individus ou des objets en temps réel, et de déclencher des alertes en cas d'activités suspectes. Cette fonction est fondamentale pour les applications de construction telles que les systèmes d'alarme de sécurité.
Analyse d'images médicales: Dans le domaine de la santé, les boîtes englobantes aident les cliniciens à mettre en évidence les anomalies potentielles, telles que les tumeurs, dans les scanners, ce qui permet d'accélérer le diagnostic. Vous pouvez en voir des exemples dans Radiology : Artificial Intelligence et sur notre page consacrée à l 'analyse d'images médicales.
Agriculture: Les boîtes englobantes sont utilisées dans l'agriculture de précision pour des tâches telles que l'identification des fruits à récolter, la surveillance de la santé des cultures ou la détection des parasites, comme le montre notre blog sur la vision par ordinateur dans l'agriculture.

Boîte de délimitation

Une solution flexible de licences d'entreprise pour stimuler votre innovation

Entraîner des modèles d'IA en quelques secondes avec Ultralytics YOLO

Former des modèles YOLO en toute simplicité avec Ultralytics HUB

Fonctionnement des cadres de délimitation

Types de cadres de délimitation

Relations avec d'autres concepts

Applications dans le monde réel

Plus d'informations dans cette catégorie

Explorer le GPT-5 de l'OpenAI : un système unifié intelligent

Google AlphaEarth utilise des données d'observation pour la cartographie mondiale

FastVLM : Apple présente son nouveau modèle de langage de vision rapide

Rejoindre la communauté Ultralytics