Aprende qué es la Recuperación en el aprendizaje automático, por qué es importante y cómo garantiza que los modelos de IA capturen eficazmente las instancias positivas críticas.
La recuperación es una métrica de rendimiento clave en el aprendizaje automático y la estadística, especialmente importante en tareas de clasificación y recuperación de información. Mide la capacidad de un modelo para identificar correctamente todas las instancias relevantes de un conjunto de datos. También conocida como Sensibilidad o Tasa de Verdaderos Positivos (TPR), la Recuperación responde a la pregunta: "De todas las instancias positivas reales, ¿cuántas predijo correctamente el modelo como positivas?". Una recuperación alta es crucial en situaciones en las que omitir un caso positivo (un falso negativo) tiene consecuencias importantes.
La recuperación se centra en los casos positivos reales de un conjunto de datos y cuantifica cuántos de ellos fueron capturados con éxito por el modelo. Se calcula como la relación entre los Verdaderos Positivos (TP) -instancias correctamente identificadas como positivas- y la suma de Verdaderos Positivos y Falsos Negativos (FN) -instancias que eran realmente positivas pero incorrectamente identificadas como negativas-. Un modelo con un Recall alto identifica correctamente la mayoría de las instancias positivas. Comprender el Recall es esencial para evaluar el rendimiento del modelo, a menudo visualizado mediante una Matriz de Confusión.
A menudo se habla de Recall junto con Precision. Mientras que la Recuperación mide la proporción de positivos reales identificados correctamente, la Precisión mide la proporción de positivos predichos que fueron realmente correctos (TP / (TP + Falsos Positivos)). A menudo hay un equilibrio entre Precisión y Recall; optimizar una puede a veces afectar negativamente a la otra.La elección entre priorizar Recall o Precision depende de la aplicación específica:
La puntuación F1 proporciona una única métrica que equilibra tanto la Precisión como la Recuperación.
La recuperación es una métrica de evaluación crítica en muchos campos:
En visión por ordenador, el Recall es esencial para evaluar tareas como la detección de objetos y la segmentación de imágenes. Para un modelo de detección de objetos como Ultralytics YOLOel Recall indica lo bien que el modelo encuentra todas las instancias de una clase específica de objeto dentro de una imagen. Un Recall alto significa que el modelo rara vez pasa por alto objetos que se supone que debe detectar. Se suele utilizar junto con la Precisión y la Precisión media media (mAP) para proporcionar una evaluación completa del rendimiento de la detección, como se detalla en las guías sobre Métricas de rendimiento deYOLO . Las herramientas de plataformas como Ultralytics HUB ayudan a los usuarios a realizar un seguimiento de estas métricas durante el entrenamiento y la validación del modelo. Comprender el Recall ayuda a los desarrolladores a ajustar los modelos a necesidades específicas, como garantizar una detección exhaustiva en los sistemas de alarmas de seguridad. Evaluar el rendimiento a menudo implica analizar métricas derivadas de una matriz de confusión y considerar el contexto de conjuntos de datos potencialmente desequilibrados.