Glosario

Retirada

Aprende qué es la Recuperación en el aprendizaje automático, por qué es importante y cómo garantiza que los modelos de IA capturen eficazmente las instancias positivas críticas.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La recuperación es una métrica de rendimiento clave en el aprendizaje automático y la estadística, especialmente importante en tareas de clasificación y recuperación de información. Mide la capacidad de un modelo para identificar correctamente todas las instancias relevantes de un conjunto de datos. También conocida como Sensibilidad o Tasa de Verdaderos Positivos (TPR), la Recuperación responde a la pregunta: "De todas las instancias positivas reales, ¿cuántas predijo correctamente el modelo como positivas?". Una recuperación alta es crucial en situaciones en las que omitir un caso positivo (un falso negativo) tiene consecuencias importantes.

Concepto básico

La recuperación se centra en los casos positivos reales de un conjunto de datos y cuantifica cuántos de ellos fueron capturados con éxito por el modelo. Se calcula como la relación entre los Verdaderos Positivos (TP) -instancias correctamente identificadas como positivas- y la suma de Verdaderos Positivos y Falsos Negativos (FN) -instancias que eran realmente positivas pero incorrectamente identificadas como negativas-. Un modelo con un Recall alto identifica correctamente la mayoría de las instancias positivas. Comprender el Recall es esencial para evaluar el rendimiento del modelo, a menudo visualizado mediante una Matriz de Confusión.

Recall Vs. Precisión

A menudo se habla de Recall junto con Precision. Mientras que la Recuperación mide la proporción de positivos reales identificados correctamente, la Precisión mide la proporción de positivos predichos que fueron realmente correctos (TP / (TP + Falsos Positivos)). A menudo hay un equilibrio entre Precisión y Recall; optimizar una puede a veces afectar negativamente a la otra.La elección entre priorizar Recall o Precision depende de la aplicación específica:

  • Se prefiere un Recall alto cuando el coste de omitir un caso positivo (Falso Negativo) es alto.
  • Se prefiere una Precisión Alta cuando el coste de identificar erróneamente una instancia negativa como positiva (Falso Positivo) es elevado.

La puntuación F1 proporciona una única métrica que equilibra tanto la Precisión como la Recuperación.

Aplicaciones en el mundo real

La recuperación es una métrica de evaluación crítica en muchos campos:

  • Análisis de imágenes médicas: En tareas como la detección de tumores mediante IA, una alta Recuperación es vital. Pasar por alto un tumor maligno (un Falso Negativo) podría retrasar el tratamiento con graves consecuencias. Por lo tanto, los sistemas de diagnóstico se optimizan a menudo para obtener una alta Sensibilidad (Recuperación), aunque ello signifique marcar algunos casos benignos para una revisión posterior (menor Precisión). Garantizar una detección exhaustiva es primordial en la IA sanitaria.
  • Detección de fraudes: Cuando se construyen sistemas para detectar transacciones financieras fraudulentas, es importante maximizar la Recuperación. No identificar una transacción fraudulenta (Falso Negativo) puede provocar importantes pérdidas económicas. Aunque minimizar las falsas alarmas (Falsos Positivos) también es deseable, a menudo tiene prioridad garantizar que se detecten la mayoría de las actividades fraudulentas.

Relevancia en la visión por ordenador

En visión por ordenador, el Recall es esencial para evaluar tareas como la detección de objetos y la segmentación de imágenes. Para un modelo de detección de objetos como Ultralytics YOLOel Recall indica lo bien que el modelo encuentra todas las instancias de una clase específica de objeto dentro de una imagen. Un Recall alto significa que el modelo rara vez pasa por alto objetos que se supone que debe detectar. Se suele utilizar junto con la Precisión y la Precisión media media (mAP) para proporcionar una evaluación completa del rendimiento de la detección, como se detalla en las guías sobre Métricas de rendimiento deYOLO . Las herramientas de plataformas como Ultralytics HUB ayudan a los usuarios a realizar un seguimiento de estas métricas durante el entrenamiento y la validación del modelo. Comprender el Recall ayuda a los desarrolladores a ajustar los modelos a necesidades específicas, como garantizar una detección exhaustiva en los sistemas de alarmas de seguridad. Evaluar el rendimiento a menudo implica analizar métricas derivadas de una matriz de confusión y considerar el contexto de conjuntos de datos potencialmente desequilibrados.

Leer todo