Intersección sobre Unión (IoU)

Aprenda qué es la intersección sobre la unión (IoU), cómo se calcula y su papel fundamental en la detección de objetos y la evaluación de modelos de IA.

La intersección sobre la unión (IoU) es una métrica de evaluación fundamental utilizada en visión por ordenador (VC), en particular para tareas de detección de objetos. Mide el solapamiento entre dos límites: el cuadro delimitador previsto generado por un modelo y el cuadro delimitador real, que es el contorno correcto etiquetado a mano. La puntuación resultante, un valor entre 0 y 1, cuantifica la precisión con la que un modelo ha localizado un objeto en una imagen. Una puntuación de 1 representa una coincidencia perfecta, mientras que una puntuación de 0 indica que no hay solapamiento en absoluto. Esta métrica es crucial para evaluar la precisión de localización de modelos como Ultralytics YOLO11.

Cómo funciona IoU

En esencia, IoU calcula la relación entre la intersección (área solapada) y la unión (área total cubierta por ambos recuadros) de los recuadros previstos y los recuadros reales. Imaginemos dos cuadrados superpuestos. La "intersección" es el área compartida donde se solapan. La "unión" es el área total que cubren ambos cuadrados combinados, contando la parte solapada una sola vez. Al dividir la intersección por la unión, IoU proporciona una medida estandarizada de lo bien que se alinea el recuadro previsto con el objeto real. Este sencillo pero potente concepto es la piedra angular del aprendizaje profundo (deep learning, DL) moderno para la detección de objetos.

Una parte clave del uso de IoU es establecer un "umbral de IoU". Este umbral es un valor predefinido (por ejemplo, 0,5) que determina si una predicción es correcta. Si la puntuación de IoU para una casilla predicha está por encima de este umbral, se clasifica como "verdadero positivo". Si la puntuación está por debajo, es un "falso positivo". Este umbral influye directamente en otras métricas de rendimiento como Precisión y Recall, y es un componente crítico en el cálculo de la Precisión Media Media (mAP), una métrica estándar para evaluar modelos de detección de objetos en conjuntos de datos de referencia como COCO.

Aplicaciones reales

El IoU es esencial para validar el rendimiento de innumerables sistemas de IA. He aquí un par de ejemplos:

Conducción autónoma: En la IA para coches autónomos, el IoU se utiliza para evaluar lo bien que el sistema de visión del coche detecta peatones, otros vehículos y señales de tráfico. Una puntuación alta en IoU garantiza que los recuadros delimitadores previstos sean precisos, lo que es fundamental para una navegación segura y para evitar colisiones. Empresas como Waymo dependen en gran medida de la detección precisa de objetos para la seguridad de sus sistemas autónomos.
Imágenes médicas: En el análisis de imágenes médicas, el IoU ayuda a evaluar la precisión de los modelos que identifican anomalías como tumores o lesiones en exploraciones como resonancias magnéticas o tomografías computarizadas. La localización precisa es vital para la planificación del tratamiento, y el IoU proporciona una medida fiable de si la predicción de un modelo es clínicamente útil. Esto es crucial en aplicaciones como la detección de tumores mediante modelos YOLO.

Mejorar el rendimiento de los modelos con IoU

IoU no es sólo una métrica de evaluación; también forma parte integral del propio proceso de entrenamiento. Muchas arquitecturas modernas de detección de objetos, incluidas las variantes de Ultralytics YOLOv8 y YOLO11, utilizan IoU o sus variaciones directamente en sus funciones de pérdida. Estas pérdidas avanzadas basadas en IoU, como Generalized IoU (GIoU), Distance-IoU (DIoU), o Complete-IoU (CIoU), ayudan al modelo a aprender a predecir cuadros delimitadores que no sólo se solapan bien, sino que también tienen en cuenta factores como la distancia entre centros y la coherencia de la relación de aspecto. Esto conduce a una convergencia más rápida y a un mejor rendimiento de la localización en comparación con las pérdidas por regresión tradicionales. Puede encontrar comparaciones detalladas entre diferentes modelos YOLO en nuestra documentación.

El seguimiento del IoU durante el entrenamiento del modelo y el ajuste de hiperparámetros ayuda a los desarrolladores a perfeccionar los modelos para una mejor localización. Herramientas como Ultralytics HUB permiten realizar un seguimiento del IoU y otras métricas, agilizando el ciclo de mejora de los modelos. A pesar de su gran utilidad, el IoU estándar a veces puede resultar insensible, especialmente en el caso de cajas no solapadas. Esta limitación impulsó el desarrollo de las variantes de IoU antes mencionadas. No obstante, IoU sigue siendo una piedra angular de la evaluación de la visión por ordenador.

IoU frente a otras métricas

Aunque el IoU es vital, es importante comprender su relación con otras métricas:

IoU vs. Precisión: La precisión es una métrica común en tareas de clasificación, que mide el porcentaje de predicciones correctas. Sin embargo, no es adecuada para la detección de objetos porque no tiene en cuenta el error de localización. Una predicción puede clasificar correctamente un objeto pero situar mal el cuadro delimitador. IoU aborda específicamente este problema midiendo la calidad de la localización.
IoU frente a precisión media (mAP): Estos términos están relacionados pero son distintos. IoU mide la calidad de un único cuadro delimitador predicho. En cambio, mAP es una métrica global que evalúa el rendimiento del modelo en todos los objetos y clases de un conjunto de datos. Se calcula promediando los valores de precisión entre varios umbrales de IoU y todas las clases. Básicamente, el IoU es un componente básico para calcular el mAP. Encontrará una explicación detallada de esta relación en nuestra guía de métricas de rendimiento YOLO.
IoU frente a la puntuación F1: La puntuación F1 es la media armónica de la precisión y la recuperación, y se utiliza a menudo en clasificación. Mientras que la precisión y la recuperación se utilizan para calcular el mAP, la puntuación F1 no mide directamente la calidad de la localización como lo hace el IoU. Se centra más en el equilibrio entre encontrar todas las instancias positivas y la corrección de esos hallazgos.

Intersección sobre Unión (IoU)

Solución flexible de licencias empresariales para impulsar su innovación

Entrene modelos de IA en segundos con Ultralytics YOLO

Entrene modelos YOLO de forma sencilla con Ultralytics HUB

Cómo funciona IoU

Aplicaciones reales

Mejorar el rendimiento de los modelos con IoU

IoU frente a otras métricas

Leer más en esta categoría

Exploración del GPT-5 de OpenAI: un sistema unificado inteligente

Google AlphaEarth utiliza datos de observación para la cartografía mundial

FastVLM: Apple presenta su nuevo modelo de lenguaje de visión rápida

Únase a la comunidad Ultralytics