Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Matriz de Confusión

Descubra cómo una matriz de confusión evalúa el rendimiento de la clasificación. Explore TP, FP, TN y FN para optimizar sus modelos Ultralytics y obtener una mayor precisión.

Una matriz de confusión es una herramienta de medición del rendimiento para problemas de clasificación de aprendizaje automático en los que el resultado puede ser de dos o más clases. Se trata de una tabla con cuatro combinaciones diferentes de valores previstos y reales, que sirve como elemento fundamental para la visualización de datos en la evaluación de modelos. A diferencia de la simple precisión, que puede ser engañosa si el conjunto de datos está desequilibrado, una matriz de confusión proporciona un desglose detallado de dónde comete errores un modelo de visión artificial (CV). Al comparar las predicciones con las etiquetas de la verdad fundamental, los desarrolladores pueden determinar si el sistema está confundiendo dos clases específicas o si no detect objeto por completo.

Componentes básicos de la matriz

La matriz en sí misma se divide normalmente en cuatro cuadrantes para la clasificación binaria, aunque se amplía para problemas multiclase como los que maneja Ultralytics . Estos cuatro componentes representan la intersección de lo que predijo el modelo frente a lo que realmente existe en la imagen.

  • Verdaderos positivos (TP): El modelo predice correctamente la clase positiva. Por ejemplo, en una tarea de detección de objetos, el modelo dibuja con éxito un cuadro delimitador alrededor de una persona que realmente se encuentra en el encuadre.
  • Verdaderos negativos (TN): El modelo predice correctamente la clase negativa. Esto es crucial en escenarios como la detección de anomalías, donde el sistema identifica correctamente que una pieza fabricada no tiene defectos.
  • Falsos positivos (FP): El modelo predice incorrectamente la clase positiva. A menudo denominado «error de tipo I», esto ocurre cuando el sistema detecta un objeto que no está presente, como una cámara de seguridad que señala una sombra como un intruso.
  • Falsos negativos (FN): El modelo predice incorrectamente la clase negativa. Conocido como «error de tipo II», esto ocurre cuando el modelo no detect objeto que está presente, esencialmente «perdiendo» el objetivo.

Métricas derivadas y significación

Los números brutos de una matriz de confusión se utilizan para calcular métricas más avanzadas que describen el rendimiento del modelo. Comprender estas derivadas es esencial para optimizar las redes neuronales.

  • Precisión: calculada como TP / (TP + FP), esta métrica revela la exactitud de las predicciones positivas. Una alta precisión significa menos falsas alarmas.
  • Recuerdo (sensibilidad): Calculado como TP / (TP + FN), mide la capacidad del modelo para encontrar todas las instancias positivas. Un recuerdo alto es vital cuando la pérdida de un objeto tiene graves consecuencias.
  • Puntuación F1: La media armónica de la precisión y la recuperación. Proporciona una puntuación única que equilibra la compensación entre ambos, útil para comparar diferentes modelos YOLO26.

Aplicaciones en el mundo real

El coste específico de los errores definido por la matriz de confusión determina cómo se ajustan los modelos para diferentes sectores.

En el campo de la IA en la asistencia sanitaria, la matriz de confusión es una cuestión de seguridad. Al entrenar un modelo para el análisis de imágenes médicas con el fin de detect , un falso negativo (pasar por alto un tumor) es mucho peor que un falso positivo (señalar una mancha benigna para que la revise el médico). Por lo tanto, los ingenieros dan prioridad a la recuperación sobre la precisión en estas matrices para garantizar que no se pasen por alto posibles riesgos para la salud .

Por el contrario, en control de calidad de la fabricación, la eficiencia es clave. Si un sistema que clasifica piezas en una línea de montaje genera demasiados falsos positivos (marcando piezas buenas como defectuosas), provoca un desperdicio innecesario y ralentiza la producción. En este caso, la matriz de confusión ayuda a los ingenieros a ajustar el modelo para maximizar la precisión, asegurando que lo que se rechaza es realmente defectuoso, lo que optimiza los flujos de trabajo automatizados de aprendizaje automático .

Generación de una matriz de confusión con YOLO26

Cuando se utilizan marcos modernos, la generación de esta matriz suele formar parte del proceso de validación estándar. El ejemplo siguiente muestra cómo validar un Modelo YOLO26 y acceda a los datos de la matriz de confusión utilizando el ultralytics paquete.

from ultralytics import YOLO

# Load a pre-trained YOLO26 model
model = YOLO("yolo26n.pt")

# Validate the model on the COCO8 dataset
# This automatically generates and plots the confusion matrix
metrics = model.val(data="coco8.yaml")

# Access the confusion matrix object directly
print(metrics.confusion_matrix.matrix)

Diferenciar conceptos relacionados

Es importante distinguir la matriz de confusión de términos de evaluación similares.

  • Vs. Precisión: La precisión es simplemente la relación entre las predicciones correctas y el total de predicciones. Aunque útil, la precisión puede ser muy engañosa en conjuntos de datos desequilibrados. Por ejemplo, si el 95 % de los correos electrónicos no son spam, un modelo que predice «no es spam» para todos los correos electrónicos tiene una precisión del 95 %, pero es inútil. La matriz de confusión revela este defecto al mostrar cero verdaderos positivos para la clase de spam.
  • Vs. Curva ROC: La matriz de confusión proporciona una instantánea del rendimiento en un único umbral de confianza específico. Por el contrario, la curva característica operativa del receptor (ROC) visualiza cómo cambian la tasa de verdaderos positivos y la tasa de falsos positivos a medida que varía ese umbral. Herramientas como la Ultralytics permiten a los usuarios explorar ambas visualizaciones para elegir el punto operativo óptimo para su implementación.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora