Aprende qué es la Intersección sobre Unión (IoU), cómo se calcula y su papel fundamental en la detección de objetos y la evaluación de modelos de IA.
La intersección sobre la unión (IoU) es una métrica fundamental muy utilizada en visión por ordenador, sobre todo en tareas como la detección de objetos y la segmentación de imágenes. Cuantifica la precisión con la que un límite predicho (como un cuadro delimitador en la detección de objetos) coincide con el límite real y verdadero de un objeto. Esencialmente, IoU mide el grado de solapamiento entre el área predicha y el área real, proporcionando una puntuación sencilla pero eficaz del rendimiento de la localización. Comprender el IoU es esencial para evaluar y comparar la eficacia de los modelos de visión por ordenador.
El IoU sirve como indicador crítico de rendimiento a la hora de evaluar la eficacia de modelos como Ultralytics YOLOlocalizan objetos en una imagen. Mientras que la clasificación nos dice qué objeto está presente, el IoU nos dice lo bien que el modelo ha localizado su ubicación. Esta precisión espacial es vital en muchos escenarios del mundo real, donde una localización precisa es tan importante como una clasificación correcta. Las puntuaciones altas de IoU indican que las predicciones del modelo coinciden con los límites reales del objeto. Muchas pruebas de detección de objetos, como la evaluación del conjunto de datos COCO y el antiguo reto PASCAL VOC, se basan en gran medida en los umbrales de IoU.
El cálculo consiste en dividir el área donde se solapan el cuadro delimitador previsto y el cuadro delimitador real (la intersección) por el área total cubierta por ambos cuadros combinados (la unión). Esta relación da como resultado una puntuación entre 0 y 1. Una puntuación de 1 significa una coincidencia perfecta, es decir, que el recuadro predicho coincide exactamente con el recuadro real. Una puntuación de 0 indica que no hay solapamiento alguno. Una práctica habitual en muchos protocolos de evaluación de detección de objetos es considerar que una predicción es correcta si la puntuación IoU alcanza o supera un determinado umbral, a menudo 0,5, aunque pueden utilizarse umbrales más estrictos en función de las necesidades de la aplicación.
La capacidad del IoU para medir la precisión de la localización lo hace indispensable en diversos ámbitos:
Aunque el IoU mide específicamente la calidad de la localización, a menudo se utiliza junto con otras métricas para obtener una imagen completa del rendimiento. La Precisión Media Promedio (mAP) es una métrica muy utilizada que tiene en cuenta tanto la precisión (la exactitud de las predicciones positivas) como la recuperación (la capacidad de encontrar todas las instancias relevantes) a través de varios umbrales de IoU. A diferencia de IoU, que evalúa predicciones individuales, mAP proporciona una puntuación agregada a través de diferentes clases y umbrales, ofreciendo una evaluación más amplia de la calidad del modelo. Puedes obtener más información sobre estas métricas en nuestra guía Métricas de rendimientoYOLO . Comprender la relación entre precisión y recall es clave para interpretar el mAP.
El IoU no es sólo una métrica de evaluación; también forma parte del propio proceso de entrenamiento. Por ejemplo, los cálculos de IoU se utilizan a menudo dentro de las funciones de pérdida (como las pérdidas GIoU, DIoU, CIoU) para optimizar directamente la capacidad del modelo de predecir recuadros delimitadores precisos. Controlar el IoU durante el entrenamiento y el ajuste de hiperparámetros ayuda a los desarrolladores a refinar los modelos para una mejor localización. Herramientas como Ultralytics HUB permiten seguir el IoU y otras métricas, agilizando el ciclo de mejora del modelo. A pesar de su utilidad, el IoU puede ser sensible a la escala del objeto y a pequeños errores de posición, pero sigue siendo una piedra angular de la evaluación de la visión por ordenador.