Glossaire

Intersection sur l'Union (IoU)

Apprends ce qu'est l'intersection sur l'union (IoU), comment elle est calculée et son rôle essentiel dans la détection des objets et l'évaluation des modèles d'IA.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

L'intersection sur l'union (IoU) est une mesure fondamentale très utilisée en vision artificielle (CV), en particulier pour des tâches telles que la détection d'objets et la segmentation d'images. Elle quantifie la précision avec laquelle une limite prédite (comme une boîte de délimitation dans la détection d'objets) correspond à la limite réelle d'un objet. Essentiellement, l'indice d'utilité mesure le degré de chevauchement entre la zone prédite et la zone réelle, fournissant ainsi un score simple mais efficace pour la performance de la localisation. Il est essentiel de comprendre l'indice d'utilité pour évaluer et comparer l'efficacité des modèles de vision artificielle, en particulier pour les utilisateurs familiarisés avec les concepts de base de l 'apprentissage machine (ML).

Importance de l'IoU dans l'évaluation du modèle

L'indice d'utilité sert d'indicateur de performance critique lorsqu'il s'agit d'évaluer l'efficacité des modèles, tels qu'Ultralytics. Ultralytics YOLOlocalisent les objets dans une image. Alors que la classification nous indique quel objet est présent (voir Classification de l'image), l'indice d'utilité nous indique dans quelle mesure le modèle a localisé cet objet. Cette précision spatiale est vitale dans de nombreux scénarios du monde réel où une localisation précise est aussi importante qu'une classification correcte. Les scores élevés de l'indice d'utilité indiquent que les prédictions du modèle s'alignent étroitement sur les limites réelles de l'objet. De nombreux critères de référence pour la détection d'objets, comme l'évaluation du populaire ensemble de données COCO et l'ancien défi PASCAL VOC, s'appuient fortement sur les seuils de l'indice d'utilité pour déterminer si une détection est considérée comme correcte. Tu peux explorer divers ensembles de données de référence comme COCO et PASCAL VOC dans notre documentation.

Calculer l'indice d'utilité

Le calcul consiste à diviser la zone où la boîte de délimitation prédite et la boîte de délimitation de la vérité terrain se chevauchent (l'intersection) par la zone totale couverte par les deux boîtes combinées (l'union). Ce rapport donne lieu à un score compris entre 0 et 1. Un score de 1 signifie une correspondance parfaite, c'est-à-dire que la boîte prédite recouvre exactement la boîte de vérité au sol. Un score de 0 indique qu'il n'y a aucun chevauchement. Une pratique courante dans de nombreux protocoles d'évaluation de la détection d'objets consiste à considérer qu'une prédiction est correcte si le score de l'IoU atteint ou dépasse un certain seuil, souvent 0,5. Cependant, des seuils plus stricts (par exemple, 0,75 ou même 0,9) peuvent être utilisés en fonction du besoin de précision de l'application, comme le montrent des mesures telles que mAP@.5 :.95 utilisées dans les évaluations COCO. Ce seuil a un impact direct sur les mesures telles que la précision et le rappel.

Applications de l'IdO dans le monde réel

La capacité de l'IoU à mesurer la précision de la localisation le rend indispensable dans divers domaines :

  • Véhicules autonomes : Dans l'IA pour les voitures autonomes, détecter avec précision les piétons, les cyclistes et les autres véhicules est primordial pour la sécurité. Un modèle de détection d'objets comme YOLO11 prédit des boîtes de délimitation autour de ces objets. Un IoU élevé entre la boîte prédite et l'emplacement réel de l'objet garantit que le système de la voiture a une compréhension précise de son environnement, ce qui est crucial pour la navigation et l'évitement des collisions. Les normes de sécurité des véhicules autonomes reposent souvent implicitement sur une grande précision de localisation.
  • Analyse d'images médicales : Lors de l'utilisation de l'IA dans le domaine de la santé, en particulier pour l'analyse d'images médicales, l'IoU aide à évaluer les modèles conçus pour détecter les tumeurs ou les anomalies dans les scans (comme la tomodensitométrie ou l'IRM). Par exemple, un modèle qui segmente une tumeur(segmentation d'image) doit en tracer le contour avec précision. Le rapport coût-efficacité mesure le chevauchement entre la région tumorale prédite par le modèle et la région marquée par un radiologue (vérité de terrain), ce qui garantit que les résultats du modèle sont cliniquement pertinents. Un indice d'utilité élevé est essentiel à la précision du diagnostic et à la planification du traitement, comme le soulignent diverses études sur l'IA dans le domaine de l'imagerie médicale. Tu peux trouver des ensembles de données pertinents comme l'ensemble de données sur la détection des tumeurs cérébrales dans nos ressources d'ensembles de données.

L'indice d'utilité par rapport à d'autres mesures d'évaluation Autres mesures d'évaluation

Bien que l'indice d'utilité mesure spécifiquement la qualité de la localisation pour une prédiction unique par rapport à une vérité de terrain, il est souvent utilisé avec d'autres mesures pour obtenir une image complète des performances.

  • Précision moyenne (mAP) : Il s'agit d'une métrique agrégée largement utilisée dans la détection d'objets. Elle calcule la précision moyenne pour différents seuils d'IoU (par exemple, de 0,5 à 0,95) et souvent pour plusieurs classes d'objets. Contrairement à l'IoU, qui évalue les prédictions individuelles, le mAP fournit un chiffre unique qui résume les performances globales du modèle en termes de classification et de précision de localisation sur différents points de fonctionnement. Tu peux en savoir plus sur ces mesures dans notre guide sur les mesures de performance deYOLO .
  • Précision et rappel : L'IoU lui-même ne mesure pas directement l'exactitude de la classification, mais seulement le chevauchement de la localisation. La précision mesure l'exactitude des prédictions positives (combien de boîtes détectées contiennent réellement un objet), tandis que le rappel mesure la capacité du modèle à trouver toutes les instances pertinentes (combien d'objets réels ont été détectés). Les seuils de l'IoU sont utilisés dans le calcul de la précision et du rappel pour déterminer si une détection est un vrai positif. Il est essentiel de comprendre la relation entre la précision et le rappel pour interpréter des mesures telles que le mAP et le score F1.

Améliorer la performance des modèles grâce à l'interface utilisateur

L'indice d'utilité n'est pas seulement une mesure d'évaluation ; il fait également partie intégrante du processus de formation lui-même. De nombreuses architectures modernes de détection d'objets, y compris les variantes de Ultralytics YOLOv8 et YOLOv10, utilisent le rapport coût-efficacité ou ses variations (comme le rapport coût-efficacité généralisé (GIoU), le rapport coût-distance (DIoU) ou le rapport coût-efficacité complet (CIoU)) directement dans leurs fonctions de perte. Ces pertes avancées basées sur l'IoU aident le modèle à apprendre à prédire des boîtes de délimitation qui non seulement se chevauchent bien, mais qui prennent également en compte des facteurs tels que la distance entre les centres et la cohérence du rapport d'aspect, ce qui entraîne une convergence plus rapide et de meilleures performances de localisation par rapport aux pertes de régression traditionnelles. Tu peux trouver des comparaisons détaillées entre les différents modèles YOLO dans notre documentation.

Le suivi de l'IoU pendant l'entraînement du modèle et le réglage des hyperparamètres aide les développeurs à affiner les modèles pour une meilleure localisation. Des outils comme Ultralytics HUB permettent de suivre l'IoU et d'autres paramètres, rationalisant ainsi le cycle d'amélioration des modèles. Malgré son utilité très répandue, l'IoU standard peut parfois être insensible, en particulier pour les boîtes qui ne se chevauchent pas ou les boîtes d'échelles très différentes. C'est ce qui a motivé le développement des variantes de l'indice d'utilité mentionnées ci-dessus. Néanmoins, l'IoU reste une pierre angulaire de l'évaluation de la vision par ordinateur et un concept clé de l'apprentissage profond (DL).

Tout lire