Glosario

Precisión

Descubre la importancia de la precisión en el aprendizaje automático, su cálculo, las limitaciones con conjuntos de datos desequilibrados y las formas de mejorar el rendimiento de los modelos.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La precisión es una métrica de rendimiento fundamental en el aprendizaje automático (AM), en particular para las tareas de clasificación. Mide la proporción de predicciones totales que un modelo identificó correctamente. En pocas palabras, responde a la pregunta "De todas las predicciones realizadas, ¿cuántas fueron realmente correctas?" Proporciona una visión general directa y de alto nivel del rendimiento general de un modelo en un conjunto de datos determinado.

Comprender la precisión

La precisión se calcula dividiendo el número de predicciones correctas (tanto verdaderos positivos como verdaderos negativos) por el número total de predicciones realizadas. Aunque intuitiva, la precisión por sí sola a veces puede ser engañosa, sobre todo cuando se trata de conjuntos de datos desequilibrados, es decir, situaciones en las que una clase supera significativamente a otras. Por ejemplo, si un conjunto de datos contiene un 95% de correos electrónicos no spam y un 5% de correos spam, un modelo que simplemente predijera "no spam" para cada correo electrónico alcanzaría una precisión del 95%, a pesar de ser inútil para identificar el spam real. Por tanto, es crucial tener en cuenta la precisión junto con otras métricas de evaluación para obtener una imagen completa del rendimiento del modelo. Puedes obtener más información sobre la evaluación de modelos y las estrategias de ajuste.

Precisión frente a otras métricas

Es importante distinguir la precisión de las métricas relacionadas:

  • Precisión: Mide la proporción de identificaciones positivas que fueron realmente correctas. Responde a: "De todos los elementos pronosticados como positivos, ¿cuántos lo fueron realmente?". Una precisión elevada es crucial cuando el coste de un falso positivo es alto.
  • Recall (Sensibilidad): Mide la proporción de positivos reales que se identificaron correctamente. Responde a: "De todos los verdaderos positivos, ¿cuántos identificó correctamente el modelo?". Una alta recuperación es vital cuando omitir un caso positivo (falso negativo) es costoso.
  • Puntuación F1: La media armónica de Precisión y Recuperación, que proporciona una única puntuación que equilibra ambas métricas. Es especialmente útil cuando se trata de clases desequilibradas.
  • Precisión media promedio (mAP): Una métrica habitual en tareas de detección de objetos, como las realizadas por Ultralytics YOLO que tiene en cuenta tanto la corrección de la clasificación como la precisión de la localización(Intersección sobre Unión - IoU). La precisión simple no es adecuada en este caso, ya que no tiene en cuenta la colocación del cuadro delimitador.

Estas métricas suelen derivarse de una Matriz de Confusión, que proporciona un desglose detallado de las clasificaciones correctas e incorrectas de cada clase. Comprender estas métricas de rendimientoYOLO es esencial.

Aplicaciones y ejemplos reales

La precisión sirve como métrica de referencia en muchas aplicaciones:

  1. Filtrado de correo basura: Al clasificar los correos electrónicos como "spam" o "no spam", la precisión indica el porcentaje total de correos electrónicos categorizados correctamente. Sin embargo, debido al porcentaje típicamente bajo de correos electrónicos spam(un problema de desequilibrio del conjunto de datos), basarse únicamente en la precisión podría ser engañoso. Métricas como la precisión y la recuperación suelen ser más informativas en este caso para garantizar que se detecta el spam sin marcar incorrectamente los correos legítimos.
  2. Análisis de imágenes médicas: Considera un modelo de IA en sanidad diseñado para clasificar las exploraciones médicas según muestren un tumor ("positivo") o no ("negativo"). Aunque la precisión general es importante, la recuperación es fundamental. Pasar por alto un tumor (un falso negativo) puede tener graves consecuencias, por lo que es primordial asegurarse de que el modelo identifique el mayor número posible de casos de tumores reales, aunque ello implique una menor precisión (más falsos positivos que requieran una revisión posterior). Plataformas como Ultralytics HUB pueden ayudar a gestionar el proceso de formación y evaluación de tales modelos.

Precisión en Ultralytics

En el ecosistema Ultralytics , la precisión es una de las diversas métricas utilizadas para evaluar el rendimiento de los modelos, especialmente en tareas de clasificación de imágenes. Al comparar modelos, como YOLO11 frente a YOLOv8, las referencias de precisión en conjuntos de datos estándar como ImageNet proporcionan valiosos puntos de comparación, junto con la velocidad de inferencia y el coste computacional. Sin embargo, para las tareas de detección y segmentación, se da prioridad a métricas como mAP, ya que reflejan mejor los retos específicos de esas tareas.

Leer todo