Glossaire

Boîte de délimitation

Apprends comment les boîtes englobantes permettent la détection d'objets, l'IA et les systèmes d'apprentissage automatique. Explore leur rôle dans les applications de vision par ordinateur !

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

Une boîte de délimitation est un cadre rectangulaire utilisé en vision artificielle (CV) pour indiquer l'emplacement et l'étendue d'un objet dans une image ou une trame vidéo. Ces boîtes sont généralement définies par les coordonnées de leurs coins supérieur gauche et inférieur droit, ce qui constitue un moyen simple mais efficace de spécifier l'emplacement d'un objet et l'espace qu'il occupe. Les boîtes de délimitation sont des composants fondamentaux dans diverses tâches de CV, notamment la détection d'objets, le suivi d'objets et l'annotation d'images, formant la pierre angulaire de nombreux systèmes modernes d'intelligence artificielle (IA) et d'apprentissage machine (ML).

Importance dans la détection d'objets

Les boîtes de délimitation sont essentielles pour l'entraînement et l'évaluation des modèles de détection d'objets. Dans les tâches abordées par des modèles comme Ultralytics YOLOles boîtes englobantes servent de vérité de terrain pendant la formation, en apprenant au modèle à localiser précisément les objets. Au cours de l'inférence, le modèle prédit des boîtes de délimitation autour des objets détectés. Cette capacité de localisation est cruciale pour les applications qui nécessitent non seulement l'identification des objets, mais aussi leur position exacte, comme dans les véhicules autonomes ou les systèmes robotiques. Le processus commence souvent par une annotation minutieuse des données, où des humains ou des outils automatisés dessinent des boîtes de délimitation autour des objets dans les images d'apprentissage, souvent à l'aide d'outils tels que CVAT.

Concepts clés liés aux boîtes de délimitation

Plusieurs mesures et techniques sont étroitement associées à l'utilisation et à l'évaluation des boîtes de délimitation dans les modèles ML :

  • Intersection sur Union (IoU) : Une métrique utilisée pour mesurer le chevauchement entre la boîte de délimitation prédite et la boîte de délimitation de la vérité terrain.
  • Suppression non maximale (NMS): technique utilisée pour éliminer les boîtes de délimitation redondantes qui détectent le même objet, en ne conservant que celle dont le score de confiance est le plus élevé.
  • Précision moyenne (mAP) : Une mesure commune pour évaluer la performance des modèles de détection d'objets, reposant fortement sur les calculs de l'IoU.
  • Boîtes d'ancrage: Boîtes prédéfinies de différentes tailles et rapports d'aspect utilisées par certains détecteurs pour aider à prédire les boîtes de délimitation plus efficacement. Les ensembles de données de référence comme COCO sont souvent utilisés pour évaluer les modèles basés sur ces concepts.

Boîtes de délimitation et termes connexes

Alors que les boîtes de délimitation localisent les objets à l'aide de rectangles, d'autres techniques de vision par ordinateur offrent différents niveaux de détail :

  • Segmentation d'images: Contrairement aux boîtes de délimitation qui fournissent une localisation rectangulaire, segmentation des images vise à classer chaque pixel d'une image.
    • La segmentation sémantique attribue une étiquette de classe (par exemple, voiture, personne, route) à chaque pixel mais ne fait pas de distinction entre les différentes instances de la même classe.
    • La segmentation d'instance va plus loin en identifiant et en délimitant chaque instance d'objet individuel à l'aide d'un masque au niveau du pixel, offrant ainsi plus de détails qu'une boîte englobante. Tu peux en savoir plus sur les tâches de segmentation d'instance.
  • Boîtes de délimitation orientées (OBB): Les boîtes de délimitation standard sont alignées sur les axes. Pour les objets qui sont tournés, les boîtes de délimitation orientées (OBB) fournissent un ajustement plus serré en faisant tourner la boîte en même temps que l'objet. Ceci est particulièrement utile dans des applications telles que l'analyse d'images aériennes ou la détection d'objets dans des scènes encombrées, souvent évaluées sur des ensembles de données comme DOTA.

Applications dans le monde réel

Les boîtes de délimitation font partie intégrante de nombreuses applications pratiques de l'intelligence artificielle :

Véhicules autonomes

Dans le cadre du développement de l'IA dans les voitures auto-conduites, les boîtes de délimitation sont essentielles pour détecter et suivre les piétons, les cyclistes, les autres véhicules et les obstacles sur la route. La détection précise et en temps réel des objets à l'aide des boîtes de délimitation permet au système du véhicule de prendre des décisions éclairées pour naviguer en toute sécurité et éviter les collisions, en respectant les directives de sécurité énoncées par des organisations telles que la National Highway Traffic Safety Administration (NHTSA). Explore davantage le rôle de l'IA dans les voitures auto-conduites.

Gestion des stocks dans le commerce de détail

Les détaillants utilisent la détection d'objets avec des boîtes englobantes pour surveiller automatiquement les rayons et gérer les stocks. Les caméras équipées de modèles d'IA peuvent détecter les produits, compter les niveaux de stock, identifier les articles mal placés et suivre les interactions des clients avec la marchandise. Cela permet d'améliorer l'efficacité, de réduire les efforts manuels et de fournir des données précieuses pour optimiser l'agencement des magasins et le réapprovisionnement des stocks. Les aperçus de ces tendances technologiques du commerce de détail soulignent l'importance croissante de l'IA dans le secteur. Tu peux trouver diverses solutionsUltralytics pour différents secteurs d'activité.

Tout lire