用語集

受信者動作特性(ROC)曲線

ROC曲線とAUCがAI/MLにおける分類器の性能をどのように評価し、不正検出や医療診断のようなタスクにおけるTPRとFPRをどのように最適化するかを学びます。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

ROC(Receiver Operating Characteristic)曲線とは、二値分類器システムの識別しきい値を変化させたときの診断能力を示すグラフプロットである。これは、機械学習モデルが2つのクラス(例えば、正と負、スパムとそうでないもの)をどの程度区別できるかを視覚化するのに役立ちます。この曲線は、様々な閾値設定における偽陽性率(FPR)に対する真陽性率(TPR)をプロットすることで作成される。ROC曲線を理解することは、特に医療画像解析や パターン認識のような分野において、分類モデルの性能を評価・比較する上で極めて重要である。これは信号検出理論に由来しますが、現在ではAIや ディープラーニング(DL)で広く使用されています。

TPRとFPRを理解する

ROC曲線を解釈するには、その軸を理解することが不可欠である:

  • 真陽性率(TPR):感度または再現率としても知られるTPRは、モデルによって正しく識別された実際の陽性インスタンスの割合を測定します。Y軸にプロットされます。TPRが高いほど、モデルが陽性のケースを識別するのに優れていることを示します。感度に関するより詳細な情報は、Wikipediaの Sensitivity と Specificity のページにあります。
  • 偽陽性率(FPR):FPR は、モデルによって陽性と誤って識別された実際の陰性インスタンスの割合を測定する。1-特異度として計算され、X軸にプロットされる。FPR が低ければ低いほど、そのモデルはネガティブ・ケースでの誤報を避けるのに優れていることを示します。

ROC曲線は、与えられたバイナリ分類モデルのTPRとFPRの間のトレードオフを示します。分類のしきい値(インスタンスが陽性か陰性かを決定するカットオフ・ポイント)が変化すると、モデルはより多くの真陽性を識別する(TPRが増加する)可能性があるが、より多くの偽陽性を識別する(FPRが増加する)可能性がある。このトレードオフを可視化することは、アプリケーションの特定のニーズに基づいて最適な閾値を選択するのに役立ちます。

ROC曲線とAUCの解釈

ROC曲線の形と位置から、モデルの性能を知ることができる:

  • 理想曲線.左上隅を抱く曲線は,様々な閾値にわたって100%のTPRと0%のFPRを持つ完璧な分類器を表す.
  • 対角線.対角線 (y=x) に沿った曲線は,ランダムな推測と変わらない性能を持つ分類器を表します.TPR は FPR と等しい.
  • カーブの位置:対角線より上の曲線は、ランダムより良い性能を示す。曲線が左上隅に近いほど、モデルのクラス間の識別能力が高い。

ROC曲線から得られる一般的な指標は、曲線下面積(AUC)である。AUC は,すべての可能なしきい値にわたる分類器の性能を要約する1つのスカラー値を提供する.AUCが1.0であれば完璧な分類器を表し、AUCが0.5であれば(コインをひっくり返すような)ランダムな性能のモデルを意味します。Scikit-learnのようなツールはAUCを簡単に計算する機能を提供し、Ultralytics HUBのようなプラットフォームはモデルモニタリングのためにこのような可視化を統合していることが多い。

実世界での応用

ROC曲線は、二値分類の性能を評価することが重要な様々な領域で広く使用されている:

  1. 医療診断: 医療画像解析において、ROC曲線はスキャン画像からの腫瘍検出のようなタスク用に設計されたモデルの評価に役立つ。高いTPR(病気の患者を正しく識別すること)は極めて重要ですが、FPR(健康な患者を誤診すること)とのバランスをとることも同様に重要です。ROC曲線は臨床医がこのトレードオフを理解するのに役立つ。医学研究におけるROCの使用は十分に文書化されており、診断テストの評価に役立っている。Ultralytics ヘルスケアソリューションのAIをどのようにサポートしているかをご覧ください。
  2. 不正の検出金融では、ROC曲線は不正取引を検出するために構築されたモデルの性能を評価する。ここでは、不正行為を正しく識別すること(高い TPR)と、正当な取引に誤ってフラグを立てること(低い FPR)とを天秤にかけなければならない。ROCを使用してモデルを評価することは、金融機関が不正検知システムを最適化するのに役立ちます。金融におけるAIアプリケーションの詳細

その他の用途としては、スパムフィルター、天気予報(雨の予測など)、製造業の品質管理などがある。

ROC曲線と精度、プレシジョン、リコールとの比較

AccuracyPrecisionRecall(またはTPR)のようなメトリクスは貴重な情報を提供しますが、ROC曲線とAUCは、特に1つのクラスが他のクラスを大幅に上回っている不均衡なデータセットで、より包括的なビューを提供します。

  • 精度:不均衡なシナリオでは、単に多数派のクラスを予測することで高得点が得られる可能性があるため、誤解を招く可能性がある。
  • プレシジョンとリコール:ポジティブ・クラスに焦点を当てる。Precisionは陽性の予測精度を測定し、Recallは実際の陽性のカバー率を測定する。F1スコアはこれらを組み合わせたものだが、やはり閾値に依存する。
  • ROC曲線/AUC:すべてのしきい値にわたってTPRとFPRの両方を考慮することにより、陽性クラスと陰性クラスを識別するモデルの能力のしきい値に依存しない評価を提供する。これは、特にクラス分布が歪んでいる場合や、偽陽性と偽陰性のコストが大きく異なる場合に、モデルを比較するためによりロバストになります。

ROC曲線は主に二値分類タスクのためのものであることに注意することが重要である。多クラスの問題や、次のようなモデルで一般的な物体検出のようなタスクでは、ROC曲線は主に二値分類タスクのためのものである。 Ultralytics YOLO平均平均精度(mAP)やIntersection over Union(IoU)のような他のメトリクスの方が標準的です。Ultralytics YOLOようなモデルの評価に関する詳細な洞察については、YOLO パフォーマンスメトリクスのガイドを参照してください。これらのメトリクスを視覚化するには、Ultralytics HUBのようなプラットフォームと統合されたツールや、TensorBoardのようなライブラリを使用します。次のようなフレームワークがあります。 PyTorchTensorFlowなどのフレームワークを検討することができる。これらのメトリクスを理解することは、責任あるAI開発とモデルの公平性を確保するために極めて重要です(AI Ethics)。

すべて読む