受信者動作特性(ROC)曲線は、識別しきい値を変化させたときの2値分類器システムの診断能力を示すグラフ表現である。ROC曲線は、さまざまなしきい値設定における偽陽性率(FPR)に対する真陽性率(TPR)をプロットすることによって作成される。これは、分類モデルの性能を視覚化する包括的な方法として機能し、2つのクラスを区別する能力に関する洞察を提供する。このツールは、機械学習(ML)や人工知能(AI)において、異なるモデルの性能を評価・比較するために広く使用されています。
感度またはリコールとしても知られるTPRは、正しく識別された実際の陽性の割合を測定する。例えば、医療診断のシナリオでは、病気であると正しく認識された人の割合を表します。
FPRは、陽性と誤って分類された実際の陰性の割合を測定する。同じ医学的な文脈では、健康な人のうち、その疾患を持っていると誤って認識された人の割合を示す。
閾値は2値分類における重要なパラメータであり、予測された確率が正または負に分類されるポイントを決定する。しきい値を調整することで、TPRとFPRのバランスに影響を与える。低いしきい値は感度を増加させますが、偽陽性率も増加させ、高いしきい値はその逆になります。
ROC曲線はY軸にTPR、X軸にFPRでプロットされる。曲線上の各ポイントは、異なるしきい値設定を表す。左上隅に近い曲線は、さまざまなしきい値にわたってより高いTPRとより低いFPRを意味するため、より性能のよいモデルを示す。
左下から右上への対角線は、識別力を持たないランダム分類器を表します。ランダムよりも良い性能を持つモデルは,この線の上に曲線を持つ.曲線が左上隅に近いほど、そのモデルの性能は優れています。
曲線下面積(AUC)は、ROC曲線で表される分類モデルの全体的な性能を要約するスカラー値である。AUCの範囲は0から1までで、1の値は完全な分類器を表し、0.5はランダムな推測よりも性能が良くないモデルを表し、0.5以下の値はランダムよりも性能が悪いことを示唆します。
AUCは、異なるモデルを比較するための単一のメトリックを提供し、どのモデルが2つのクラスを区別する上でより良い全体的な性能を持つかを決定することを容易にします。例えば、AUCが0.85の場合、モデルはランダムに選ばれたポジティブ・インスタンスとランダムに選ばれたネガティブ・インスタンスを正しく区別する確率が85%であることを示唆します。
ROC曲線は医学研究において、診断テストの性能を評価するために広く用いられている。例えば、ある病気を検出するための新しい検査は、そのROC曲線をプロットすることで評価できる。AUC値は、誤警報(偽陽性)を最小限に抑えながら、その病気の患者(真陽性)を正しく識別する検査の有効性を判断するのに役立つ。この情報は、その検査が臨床で使用するのに十分な信頼性があるかどうかを判断するのに非常に重要です。
金融業界では、不正取引を検出するモデルの評価にROC曲線が使用される。AUC値が高いモデルは、正当な取引と不正な取引を効果的に区別することができ、銀行や金融機関が金融損失を削減し、顧客を保護するのに役立ちます。金融におけるAIの詳細
混同行列は、真陽性、真陰性、偽陽性、偽陰性の数を示すことによって、分類モデルの性能を要約した表である。混同行列が、特定の閾値におけるモデルの性能に関する詳細な情報を提供するのに対して、ROC曲線は、すべての可能な閾値にわたる広い視野を提供します。
ROC曲線と同様に,精度-再現曲線は,さまざまな閾値における再現(TPR)に対する精度をプロットする.この曲線は、一方のクラスが他方を大きく上回るような不均衡なデータ集合を扱うときに特に有用である。精度-再現曲線は、正のクラスでのモデルの性能に焦点を当て、ROC曲線とは異なる視点を提供する。
受信者動作特性(ROC)曲線は、2値分類モデルの性能を評価し可視化するための強力なツールである。さまざまなしきい値にわたる偽陽性率に対する真陽性率をプロットすることで、2つのクラスを区別するモデルの能力を包括的に見ることができます。曲線下面積(AUC)は、異なるモデルを比較する単一の指標を提供することで、この分析をさらに単純化します。ROC曲線とAUCを理解することは、機械学習やAI、特に医療診断や不正検出などの分野で働く人にとって不可欠です。より詳細な情報については、ウィキペディアのROC曲線に関する記事などを参照してください。また、Ultralytics YOLO モデルが実世界のアプリケーションでどのように使用されているかについては、当社のソリューション・ページをご覧ください。