通过混淆矩阵了解模型性能。探索改进人工智能分类准确性的指标、实际用途和工具。
混淆矩阵是机器学习(ML)中的一种基本工具,专门用于评估分类模型的性能。它简明扼要地概括了模型的预测结果与不同类别的实际真实标签的匹配程度。通过可视化每个类别的正确和错误预测计数,它提供了比单纯的准确性更深入的见解,帮助实践者了解其模型所犯的具体错误类型。
混淆矩阵将一组测试数据的预测类标签与实际类标签进行比较。对于二元分类问题(两个类别,如阳性/阴性),矩阵通常包含四个关键值:
这四个部分构成了计算各种性能指标的基础。对于多类分类问题,矩阵会扩大,显示所有类别之间的相互作用。
虽然总体准确率能提供性能的总体感知,但它可能会产生误导,尤其是在不平衡的数据集上,一个类别的数量明显多于其他类别。混淆矩阵能提供更精细的视图:
混淆矩阵广泛应用于人工智能(AI)的各个领域:
重要的是要将混淆矩阵与相关的评估工具区分开来:
在训练 Ultralytics YOLO等模型时,会在验证阶段(Val 模式)自动生成混淆矩阵。这些矩阵可以帮助用户直观地了解模型在COCO等数据集或自定义数据集中不同类别上的表现。Ultralytics HUB等工具提供了训练模型和分析结果(包括混淆矩阵)的环境,以便全面了解模型评估情况。要深入了解实践中的混淆矩阵,Scikit-learn 文档等资源提供了更多示例。