Glosario

Precisión media (mAP)

Descubre la importancia de la Precisión Media Promedio (mAP) en la evaluación de modelos de detección de objetos para aplicaciones de IA como la conducción autónoma y la asistencia sanitaria.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La Precisión Media Promedio (mAP) es una métrica muy utilizada para evaluar el rendimiento de los modelos de detección de objetos, como el popular Ultralytics YOLO de Ultralytics. Proporciona una puntuación única y completa que resume la capacidad de un modelo para identificar y localizar objetos correctamente en varias clases y niveles de confianza. A diferencia de otras métricas más sencillas, el mAP equilibra eficazmente el compromiso entre encontrar todos los objetos relevantes (recall) y garantizar que los objetos encontrados son realmente correctos (precisión), lo que lo hace crucial para evaluar los modelos utilizados en aplicaciones complejas como los sistemas autónomos y los diagnósticos médicos.

Comprender lo básico: Precisión y recuperación

Para entender el mAP, es esencial comprender primero la Precisión y el Recall. En la detección de objetos

  • Precisión: Mide cuántos de los objetos detectados son realmente correctos. Una precisión alta significa que el modelo hace pocas detecciones de falsos positivos.
  • Recuerdo: Mide cuántos de los objetos reales presentes fueron detectados correctamente por el modelo. Una recuperación alta significa que el modelo encuentra la mayoría de los objetos relevantes, minimizando los falsos negativos.

Estas dos métricas suelen tener una relación inversa; mejorar una a veces puede disminuir la otra. mAP proporciona una forma de evaluar el modelo en diferentes puntos de esta compensación. Puedes obtener más información sobre los fundamentos de Precision y Recall en Wikipedia.

Cómo se calcula el mAP

El cálculo del mAP implica varios pasos. En primer lugar, para cada clase de objeto, se ordenan las predicciones del modelo según sus puntuaciones de confianza. A continuación, se genera una curva Precisión-Recuperación calculando los valores de precisión y recuperación en varios umbrales de confianza. El Área Bajo esta Curva (AUC) da la Precisión Media (PA) para esa clase concreta. Por último, el mAP se calcula promediando los valores AP de todas las clases de objetos del conjunto de datos.

A menudo, el mAP se notifica con umbrales específicos de Intersección sobre Unión (IoU ), que miden lo bien que se solapa la caja delimitadora predicha con la caja real. Algunas variantes habituales son:

  • mAP@0.5: Calculado utilizando un umbral de IoU de 0,5. Se trata de una métrica estándar utilizada a menudo en pruebas comparativas como PASCAL VOC.
  • mAP@0.5:0.95: El mAP medio calculado sobre múltiples umbrales de IoU (de 0,5 a 0,95, normalmente en pasos de 0,05). Ésta es la métrica principal utilizada por el conjunto de datos COCO y proporciona una evaluación más estricta de la precisión de la localización.

Para ver en detalle cómo se aplican estas métricas a los modelos YOLO , consulta la guía Métricas de rendimientoYOLO .

Por qué es importante el mAP

La Precisión Media Promedio es vital porque ofrece una visión holística del rendimiento de un modelo de detección de objetos. Tiene en cuenta tanto la precisión de la clasificación (¿es correcta la clase de objeto?) como la precisión de la localización (¿se ha colocado correctamente el cuadro delimitador?) en todas las clases. Esto hace que sea más informativo que fijarse sólo en la precisión o la recuperación, especialmente en conjuntos de datos con múltiples categorías de objetos o distribuciones de clases desequilibradas. Una puntuación mAP más alta suele indicar un modelo de detección de objetos más robusto y fiable. Mejorar el mAP suele implicar técnicas como el ajuste de hiperparámetros y el uso de mejores datos de entrenamiento.

Aplicaciones en el mundo real

El mAP es fundamental en la evaluación de modelos para tareas del mundo real en las que la precisión es primordial:

  • Vehículos autónomos: Los coches autónomos necesitan detectar con fiabilidad peatones, otros vehículos, semáforos y obstáculos. Una puntuación mAP alta garantiza que el sistema de percepción sea lo suficientemente preciso para una navegación segura. Explora las soluciones de IA en la conducción autónoma para ver cómo se aplican los modelos de detección.
  • Análisis de imágenes médicas: En sanidad, los modelos que detectan tumores, lesiones u otras anomalías en exploraciones (como radiografías o resonancias magnéticas) requieren una alta mAP. Esto garantiza que los diagnósticos sean precisos, minimizando tanto las detecciones fallidas (se necesita una alta memoria) como las falsas alarmas (se necesita una alta precisión). Más información sobre la IA en aplicaciones sanitarias.

mAP frente a otras métricas

Es importante distinguir el mAP de las métricas de evaluación relacionadas:

  • Precisión: Aunque es útil para tareas de clasificación, la precisión suele ser inadecuada para la detección de objetos. No tiene en cuenta la calidad de la localización y puede ser engañosa en conjuntos de datos con dominancia del fondo o desequilibrio de clases.
  • Intersección sobre Unión (IoU): IoU mide el solapamiento entre un único cuadro delimitador predicho y su correspondiente cuadro real. Aunque los umbrales de IoU se utilizan en el cálculo del mAP para determinar si una detección es correcta, el IoU por sí mismo no proporciona una puntuación global del rendimiento en todas las clases y umbrales, como hace el mAP. Puedes encontrar más información sobre el uso de estas métricas en la guía Evaluación y ajuste del modelo.

Herramientas y referencias

Herramientas como Ultralytics HUB permiten a los usuarios entrenar, seguir y evaluar modelos, destacando el mAP como indicador clave de rendimiento. Marcos como PyTorch y TensorFlow proporcionan los bloques de construcción para estos modelos. Los conjuntos de datos estándar como COCO y PASCAL VOC utilizan mAP como métrica principal para comparar los modelos de detección de objetos, impulsando el progreso en este campo. Puedes explorar y comparar el rendimiento de varios modelos, a menudo medido por mAP, en las páginas de Comparación de ModelosUltralytics .

Leer todo