Aprenda qué es la intersección sobre la unión (IoU), cómo se calcula y su papel fundamental en la detección de objetos y la evaluación de modelos de IA.
La intersección sobre la unión (IoU) es una métrica de evaluación fundamental utilizada en visión por ordenador (VC), en particular para tareas de detección de objetos. Mide el solapamiento entre dos límites: el cuadro delimitador previsto generado por un modelo y el cuadro delimitador real, que es el contorno correcto etiquetado a mano. La puntuación resultante, un valor entre 0 y 1, cuantifica la precisión con la que un modelo ha localizado un objeto en una imagen. Una puntuación de 1 representa una coincidencia perfecta, mientras que una puntuación de 0 indica que no hay solapamiento en absoluto. Esta métrica es crucial para evaluar la precisión de localización de modelos como Ultralytics YOLO11.
En esencia, IoU calcula la relación entre la intersección (área solapada) y la unión (área total cubierta por ambos recuadros) de los recuadros previstos y los recuadros reales. Imaginemos dos cuadrados superpuestos. La "intersección" es el área compartida donde se solapan. La "unión" es el área total que cubren ambos cuadrados combinados, contando la parte solapada una sola vez. Al dividir la intersección por la unión, IoU proporciona una medida estandarizada de lo bien que se alinea el recuadro previsto con el objeto real. Este sencillo pero potente concepto es la piedra angular del aprendizaje profundo (deep learning, DL) moderno para la detección de objetos.
Una parte clave del uso de IoU es establecer un "umbral de IoU". Este umbral es un valor predefinido (por ejemplo, 0,5) que determina si una predicción es correcta. Si la puntuación de IoU para una casilla predicha está por encima de este umbral, se clasifica como "verdadero positivo". Si la puntuación está por debajo, es un "falso positivo". Este umbral influye directamente en otras métricas de rendimiento como Precisión y Recall, y es un componente crítico en el cálculo de la Precisión Media Media (mAP), una métrica estándar para evaluar modelos de detección de objetos en conjuntos de datos de referencia como COCO.
El IoU es esencial para validar el rendimiento de innumerables sistemas de IA. He aquí un par de ejemplos:
IoU no es sólo una métrica de evaluación; también forma parte integral del propio proceso de entrenamiento. Muchas arquitecturas modernas de detección de objetos, incluidas las variantes de Ultralytics YOLOv8 y YOLO11, utilizan IoU o sus variaciones directamente en sus funciones de pérdida. Estas pérdidas avanzadas basadas en IoU, como Generalized IoU (GIoU), Distance-IoU (DIoU), o Complete-IoU (CIoU), ayudan al modelo a aprender a predecir cuadros delimitadores que no sólo se solapan bien, sino que también tienen en cuenta factores como la distancia entre centros y la coherencia de la relación de aspecto. Esto conduce a una convergencia más rápida y a un mejor rendimiento de la localización en comparación con las pérdidas por regresión tradicionales. Puede encontrar comparaciones detalladas entre diferentes modelos YOLO en nuestra documentación.
El seguimiento del IoU durante el entrenamiento del modelo y el ajuste de hiperparámetros ayuda a los desarrolladores a perfeccionar los modelos para una mejor localización. Herramientas como Ultralytics HUB permiten realizar un seguimiento del IoU y otras métricas, agilizando el ciclo de mejora de los modelos. A pesar de su gran utilidad, el IoU estándar a veces puede resultar insensible, especialmente en el caso de cajas no solapadas. Esta limitación impulsó el desarrollo de las variantes de IoU antes mencionadas. No obstante, IoU sigue siendo una piedra angular de la evaluación de la visión por ordenador.
Aunque el IoU es vital, es importante comprender su relación con otras métricas: