Yolo 深圳
深セン
今すぐ参加
用語集

Receiver Operating Characteristic (ROC)曲線

二値分類器を評価するための受信者動作特性(ROC)曲線の活用方法を学びます。Ultralytics 真陽性率(TPR)と偽陽性率(FPR)のトレードオフを探求します。

受信者動作特性(ROC)曲線は、二値分類モデルの性能を評価するために用いられる基本的な図形ツールである。機械学習(ML)の領域において、これはあらゆる可能な決定閾値にわたってモデルの感度と特異度のトレードオフを可視化する。 データセットの不均衡により誤解を招く可能性がある精度のような単一値指標とは異なり、ROC曲線は陽性事例を識別する基準が厳しくなるにつれて分類器がどのように振る舞うかを包括的に示す。この可視化は、教師あり学習技術を利用するエンジニアが特定のユースケースに最適な動作点を決定するために不可欠である。

軸とトレードオフの解釈

ROC曲線を理解するには、互いにプロットされた2つのパラメータ、すなわち真陽性率(TPR)と偽陽性率(FPR)を考察する必要がある。

  • 真陽性率(TPR): リコールまたは感度とも呼ばれるこの指標は、y軸上で モデルが正しく識別した実際の陽性観測値の割合を測定します。 高いTPRは、システムが対象を見逃すことが稀であることを意味します。
  • 偽陽性率(FPR):x軸にプロットされ、陰性インスタンスのうち誤って陽性と分類されたものの比率を表す。 「誤警報」とも呼ばれる。

この曲線は動的な関係を示している:より多くの陽性例を捕捉するために 信頼閾値を下げると(真陽性率 TPR を増加させると)、 必ず陰性例を誤ってフラグ付けするリスクが増加する(偽陽性率 FPR を増加させる)。 完全な分類器はグラフの左上隅に位置し、100%の感度と0%の誤警報を示す。 ランダムな推測を行うモデルは左下から右上への対角線として表される。 全体的な性能は曲線下面積(AUC)で要約されることが多く、 値1.0が完全性を示す。

実際のアプリケーション

ROC曲線上の閾値設定の決定は、特定の産業アプリケーションにおける誤りのコストに完全に依存する。

  1. 医療診断: 医療分野におけるAI、特に医療画像解析における腫瘍検出などのタスクでは、 陽性例を見逃すコスト(偽陰性)は生命を脅かす可能性がある。したがって、 実務者はしばしば、偽陽性率(FPR)が高くなる結果となっても、真陽性率(TPR)を最大化する閾値を選択する。これは、より多くの健康な患者が 当初は追加検査の対象としてフラグ付けされる可能性があることを意味する。
  2. 金融詐欺検知: 金融分野でAIを クレジットカード取引の監視に活用する場合、 銀行はセキュリティと顧客体験のバランスを取る必要がある。 システムが過度に敏感(高いTPR)だと、 正当なカードをブロック(高いFPR)する可能性があり、 ユーザーを苛立たせる。 アナリストはROC曲線を用いて、 ほとんどの詐欺を捕捉しつつ 誤検知を許容可能な最小限に抑える バランスの取れた閾値を見つける。

ROC解析のための確率生成

ROC曲線を作成するには、最終的なクラスラベルだけでなく、生の予測確率が必要です。以下の例では、最先端のYOLO26モデルを使用して分類スコアを生成します。

from ultralytics import YOLO

# Load a pretrained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Run inference to get probability distribution
results = model("bus.jpg")

# Access the probability score for the predicted class
# These continuous scores are required to calculate TPR/FPR at different thresholds
print(f"Top Class Index: {results[0].probs.top1}")
print(f"Confidence Score: {results[0].probs.top1conf:.4f}")

検証セットに対してこれらの確率を収集した後、開発者はScikit-learnなどのライブラリを使用して曲線上のポイントを計算できます。データセットの管理やこれらの指標の経時的な追跡には、Ultralytics モデル評価とデプロイメントのための統合ツールを提供します。

ROC対関連概念

ROC曲線を他の評価ツールと区別することが重要です:

  • vs. 精度-再現率(PR)曲線:ROC曲線が真陽性率(TPR)と偽陽性率(FPR)の関係を示すのに対し、 精度-再現率曲線 は精度と再現率の関係を示します。データセットが著しく不均衡な場合(例: 稀な異常の検出)、PR曲線が一般的に好まれます。なぜなら、そのようなシナリオではROC曲線が過度に楽観的な見解を示すことがあるためです。
  • 混同行列対ROC曲線: 混同行列は特定の単一閾値における性能の スナップショットを提供するこれに対し、 ROC曲線はあらゆる可能な閾値にわたる性能を 可視化するため、最終的な判定ルールを確立する 前の予測モデリング分析において、より広範な ツールとなる。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加