用語集

混乱マトリックス

混同行列でモデルの性能を理解するAIの分類精度を向上させるための測定基準、実際の使用例、ツールを紹介します。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

混同行列は、分類モデルの性能を評価するために機械学習で使用される強力なツールです。これは、モデルの予測と実際の結果の包括的な内訳を提供し、モデルが犯したエラーの種類と頻度についての洞察を提供します。この可視化により、ユーザはモデルの性能だけでなく、どこで失敗しているのかを理解することができ、モデルの精度を改善・向上させるために極めて重要です。エラーの分布を理解することで、的を絞った改善を導くことができます。

コンフュージョン・マトリックスのコア・コンポーネント

混同行列は、分類問題の結果を、その数を示すことによって要約したものである:

  • True Positives (TP):モデルが正クラスを正しく予測するインスタンス。
  • 真の否定(TN):モデルが否定クラスを正しく予測した事例。
  • 偽陽性(FP):モデルが正クラスを誤って予測する事例(タイプIエラー)。
  • 偽陰性(FN):モデルが誤って否定クラスを予測する事例(タイプIIエラー)。

これら4つの構成要素はマトリックスの基礎となり、さまざまなパフォーマンス指標の算出に使用される。

コンフュージョンマトリックスから導き出される主要パフォーマンス指標

混同行列からいくつかの重要な指標を導き出すことができ、モデルの性能の定量的な尺度を提供する:

  • 精度:全予測のうち正しいものの割合(真陽性と真陰性の両方)。
  • 精度:実際に正しい識別の割合。これは、陽性クラスを予測するモデルの正確さの尺度である。
  • 回収率:正しく識別された実際の陽性の割合。これは、すべての陽性の事例を検出するモデルの能力を示す。
  • F1スコア:精度と想起の調和平均で、2つのメトリクスのバランスをとる。クラス分布が不均衡な場合に特に有用。

混乱行列の実世界での応用

コンフュージョン・マトリクスは、分類モデルを評価し、改善するために、様々な領域で使用されている。具体的な例を2つ挙げよう:

  1. 医療診断: 医療画像解析において、混同行列は医療画像から癌などの病気を検出するように設計されたモデルの性能を評価するのに役立ちます。例えば、あるモデルが腫瘍を良性と悪性に分類するとします。混同行列は、真陽性(正しく識別された悪性腫瘍)、真陰性(正しく識別された良性腫瘍)、偽陽性(誤って悪性と分類された良性腫瘍)、偽陰性(誤って良性と分類された悪性腫瘍)の数を明らかにする。この情報は、医師が診断ツールの信頼性を理解し、十分な情報に基づいた判断を下すために極めて重要である。医療におけるAIについてもっと読む。
  2. 不正検出:金融分野では、不正取引を検出するモデルを評価するために混同行列が採用されている。モデルはトランザクションを正当か不正かに分類する。混同行列は、真陽性(正しく識別された不正な取引)、真陰性(正しく識別された正当な取引)、偽陽性(誤って不正と分類された正当な取引)、偽陰性(誤って正当と分類された不正な取引)の件数を示す。これにより、金融機関はモデルを微調整して、実際の不正を見逃してしまうリスクと、正当な取引をブロックしてしまう不都合の両方を最小限に抑えることができます。データ・セキュリティについて学ぶ

コンフュージョンマトリックスを作成するためのツールと技術

いくつかのツールやフレームワークが混同行列の作成と分析をサポートしている。Ultralytics YOLO (You Only Look Once)は、混同行列を生成する組み込み機能を提供し、ユーザがモデルを評価し、微調整するのに役立つ、物体検出のための一般的なフレームワークです。さらに、Python の Scikit-learn のようなライブラリは、混同行列を計算して視覚化する関数を提供し、開発者がこの分析をワークフローに統合することを容易にします。物体検出のアーキテクチャとその応用についてもっと知る。

コンフュージョンマトリックスと他の評価手法との比較

混同行列は基本的なツールであるが、モデルの性能を包括的に理解するために、他の評価技法と一緒に使用されることが多い。例えば、ROC(Receiver Operating Characteristic)曲線や AUC(Area Under the Curve:曲線下面積)は、異なる閾値における真陽性率と偽陽性率のトレードオフに関する洞察を提供します。特定の閾値での静的なスナップショットを提供する混同行列とは異なり、ROC曲線とAUCは、さまざまな閾値にわたるモデル・パフォーマンスの動的なビューを提供します。AIとコンピュータ・ビジョンに関連する用語や定義については、Ultralytics 用語集もご覧ください。

混同行列やその他の評価ツールを活用することで、実務家はモデルの性能についてより深い洞察を得ることができ、より正確で信頼性の高いAIシステムにつなげることができる。医療診断の改善であれ、不正検出の強化であれ、混同行列はAIとMLのツールキットにおいて不可欠なツールであり続けている。

すべて読む