Descubre la importancia de la precisión en el aprendizaje automático, su cálculo, las limitaciones con conjuntos de datos desequilibrados y las formas de mejorar el rendimiento de los modelos.
La precisión es una métrica de rendimiento fundamental en el aprendizaje automático (AM), en particular para las tareas de clasificación. Mide la proporción de predicciones totales que un modelo identificó correctamente. En pocas palabras, responde a la pregunta "De todas las predicciones realizadas, ¿cuántas fueron realmente correctas?" Proporciona una visión general directa y de alto nivel del rendimiento general de un modelo en un conjunto de datos determinado.
La precisión se calcula dividiendo el número de predicciones correctas (tanto verdaderos positivos como verdaderos negativos) por el número total de predicciones realizadas. Aunque intuitiva, la precisión por sí sola a veces puede ser engañosa, sobre todo cuando se trata de conjuntos de datos desequilibrados, es decir, situaciones en las que una clase supera significativamente a otras. Por ejemplo, si un conjunto de datos contiene un 95% de correos electrónicos no spam y un 5% de correos spam, un modelo que simplemente predijera "no spam" para cada correo electrónico alcanzaría una precisión del 95%, a pesar de ser inútil para identificar el spam real. Por tanto, es crucial tener en cuenta la precisión junto con otras métricas de evaluación para obtener una imagen completa del rendimiento del modelo. Puedes obtener más información sobre la evaluación de modelos y las estrategias de ajuste.
Es importante distinguir la precisión de las métricas relacionadas:
Estas métricas suelen derivarse de una Matriz de Confusión, que proporciona un desglose detallado de las clasificaciones correctas e incorrectas de cada clase. Comprender estas métricas de rendimientoYOLO es esencial.
La precisión sirve como métrica de referencia en muchas aplicaciones:
En el ecosistema Ultralytics , la precisión es una de las diversas métricas utilizadas para evaluar el rendimiento de los modelos, especialmente en tareas de clasificación de imágenes. Al comparar modelos, como YOLO11 frente a YOLOv8, las referencias de precisión en conjuntos de datos estándar como ImageNet proporcionan valiosos puntos de comparación, junto con la velocidad de inferencia y el coste computacional. Sin embargo, para las tareas de detección y segmentación, se da prioridad a métricas como mAP, ya que reflejan mejor los retos específicos de esas tareas.