Descubra cómo una matriz de confusión evalúa el rendimiento de la clasificación. Explore TP, FP, TN y FN para optimizar sus modelos Ultralytics y obtener una mayor precisión.
Una matriz de confusión es una herramienta de medición del rendimiento para problemas de clasificación de aprendizaje automático en los que el resultado puede ser de dos o más clases. Se trata de una tabla con cuatro combinaciones diferentes de valores previstos y reales, que sirve como elemento fundamental para la visualización de datos en la evaluación de modelos. A diferencia de la simple precisión, que puede ser engañosa si el conjunto de datos está desequilibrado, una matriz de confusión proporciona un desglose detallado de dónde comete errores un modelo de visión artificial (CV). Al comparar las predicciones con las etiquetas de la verdad fundamental, los desarrolladores pueden determinar si el sistema está confundiendo dos clases específicas o si no detect objeto por completo.
La matriz en sí misma se divide normalmente en cuatro cuadrantes para la clasificación binaria, aunque se amplía para problemas multiclase como los que maneja Ultralytics . Estos cuatro componentes representan la intersección de lo que predijo el modelo frente a lo que realmente existe en la imagen.
Los números brutos de una matriz de confusión se utilizan para calcular métricas más avanzadas que describen el rendimiento del modelo. Comprender estas derivadas es esencial para optimizar las redes neuronales.
El coste específico de los errores definido por la matriz de confusión determina cómo se ajustan los modelos para diferentes sectores.
En el campo de la IA en la asistencia sanitaria, la matriz de confusión es una cuestión de seguridad. Al entrenar un modelo para el análisis de imágenes médicas con el fin de detect , un falso negativo (pasar por alto un tumor) es mucho peor que un falso positivo (señalar una mancha benigna para que la revise el médico). Por lo tanto, los ingenieros dan prioridad a la recuperación sobre la precisión en estas matrices para garantizar que no se pasen por alto posibles riesgos para la salud .
Por el contrario, en control de calidad de la fabricación, la eficiencia es clave. Si un sistema que clasifica piezas en una línea de montaje genera demasiados falsos positivos (marcando piezas buenas como defectuosas), provoca un desperdicio innecesario y ralentiza la producción. En este caso, la matriz de confusión ayuda a los ingenieros a ajustar el modelo para maximizar la precisión, asegurando que lo que se rechaza es realmente defectuoso, lo que optimiza los flujos de trabajo automatizados de aprendizaje automático .
Cuando se utilizan marcos modernos, la generación de esta matriz suele formar parte del proceso de validación estándar. El ejemplo
siguiente muestra cómo validar un
Modelo YOLO26 y acceda a los datos de la matriz de confusión
utilizando el ultralytics paquete.
from ultralytics import YOLO
# Load a pre-trained YOLO26 model
model = YOLO("yolo26n.pt")
# Validate the model on the COCO8 dataset
# This automatically generates and plots the confusion matrix
metrics = model.val(data="coco8.yaml")
# Access the confusion matrix object directly
print(metrics.confusion_matrix.matrix)
Es importante distinguir la matriz de confusión de términos de evaluación similares.