Glosario

Puntuación F1

Descubre la importancia de la puntuación F1 en el aprendizaje automático. Aprende cómo equilibra la precisión y la recuperación para una evaluación óptima del modelo.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La Puntuación F1 es una métrica crucial en el aprendizaje automático, especialmente cuando se evalúa el rendimiento de los modelos de clasificación. Proporciona una medida equilibrada de la precisión y la recuperación de un modelo, lo que la hace especialmente útil cuando se trata de conjuntos de datos desequilibrados. Comprender la Puntuación F1 es esencial para cualquiera que trabaje con inteligencia artificial y aprendizaje automático, ya que ofrece una perspectiva más matizada sobre el rendimiento del modelo que la precisión por sí sola.

Comprender la puntuación F1

La puntuación F1 es la media armónica de la precisión y la recuperación. Para entender la puntuación F1, es importante comprender primero los conceptos de precisión y recuperación. La precisión mide la exactitud de las predicciones positivas, indicando qué proporción de instancias predichas positivamente fueron realmente positivas. Una precisión alta significa que cuando el modelo predice un resultado positivo, es probable que sea correcto. Por otro lado, la recuperación mide la exhaustividad de las predicciones positivas, indicando qué proporción de casos positivos reales fueron identificados correctamente por el modelo. Una alta recuperación significa que el modelo identifica eficazmente la mayoría de los casos positivos.

La Puntuación F1 combina estas dos métricas en una única puntuación, ofreciendo una visión equilibrada del rendimiento de un clasificador, especialmente cuando hay una distribución desigual de las clases. Una puntuación F1 alta indica que el modelo tiene una precisión y una recuperación elevadas. Es especialmente valioso en situaciones como la detección de objetos mediante modelos Ultralytics YOLO , en las que es importante tanto detectar objetos con exactitud (precisión) como encontrar todos los casos de objetos presentes en una imagen (recuperación).

Relevancia y casos de uso

La puntuación F1 se utiliza ampliamente en diversas aplicaciones de IA y ML, especialmente en escenarios con conjuntos de datos desequilibrados o en los que tanto los falsos positivos como los falsos negativos tienen costes significativos. He aquí un par de ejemplos del mundo real:

Puntuación F1 frente a otras métricas

Aunque la precisión es una métrica habitual, puede ser engañosa con conjuntos de datos desequilibrados, en los que una clase supera significativamente a la otra. Por ejemplo, en un sistema de detección de fraudes en el que las transacciones fraudulentas son poco frecuentes, un modelo podría alcanzar una gran precisión si se limitara a predecir "sin fraude" la mayor parte del tiempo. Sin embargo, es probable que este modelo tenga una recuperación y una puntuación F1 bajas, al no detectar casos reales de fraude.

En tales situaciones, la Puntuación F1 proporciona una evaluación más informativa al considerar tanto la precisión como la recuperación. Si un modelo tiene una precisión alta pero una Puntuación F1 baja, sugiere un desequilibrio en la precisión y la recuperación, lo que a menudo indica que el modelo no está manejando eficazmente la clase minoritaria. Por tanto, al evaluar modelos, especialmente en tareas como la detección de objetos con Ultralytics YOLO o la clasificación de imágenes, considerar la Puntuación F1 junto con otras métricas como la Precisión Media (mAP) y la Intersección sobre la Unión (IoU ) proporciona una comprensión más completa del rendimiento del modelo. Ultralytics proporciona herramientas y guías para evaluar estas métricas de rendimientoYOLO para garantizar una selección y ajuste óptimos del modelo. Para profundizar en las métricas relacionadas, recursos como la documentación de scikit-learn sobre F1-Score ofrecen información detallada.

Leer todo