混同行列でモデルの性能を理解するAIの分類精度を向上させるための測定基準、実際の使用例、ツールを紹介します。
混同行列は機械学習(ML)、特に分類モデルの性能を評価するために使われる基本的なツールです。混同行列は、モデルの予測が、異なるクラスにわたって、実際の真実のラベルとどの程度一致するかを、明確かつ簡潔に要約します。各クラスの予測の正解と不正解のカウントを視覚化することで、単純な精度だけよりも深い洞察を提供し、モデルが犯している特定のタイプのエラーを理解するのに役立ちます。
混同行列は、テストデータの集合について、予測されたクラスラベルと実際のクラスラベルを比較します。2値分類問題(2つのクラス、例えば正/負)の場合、行列は通常4つの重要な値を含みます:
これらの4つの構成要素は、様々な性能測定基準を計算するための基礎となります。マルチクラス分類問題では、マトリックスは拡張され、すべてのクラス間の相互作用を示します。
全体的な精度は性能の一般的な感覚を与えますが、特に1つのクラスが他のクラスよりも著しく多いような不均衡なデータセットでは、誤解を招く可能性があります。混同行列は、より詳細なビューを提供します:
混乱行列は、人工知能(AI)を応用した様々な領域で広く使われている:
混乱マトリックスと関連する評価ツールを区別することは重要である:
のようなモデルをトレーニングする場合 Ultralytics YOLOのようなモデルを物体検出や 画像分類などのタスクのためにトレーニングする場合、検証段階(Valモード)で混同行列が自動的に生成されます。これらの行列は、COCOのようなデータセットやカスタムデータセット内の異なるクラスでモデルがどの程度うまく機能するかを視覚化するのに役立ちます。Ultralytics HUBのようなツールは、モデルをトレーニングし、混同行列を含む結果を分析するための環境を提供し、モデルの評価に関する包括的な洞察を得ることができます。実際に混同行列をより深く掘り下げるには、Scikit-learnのドキュメントのようなリソースがさらなる例を提供しています。