曲線下面積(AUC)は、機械学習、特に2値分類問題において、モデルの性能を評価するために広く使われている指標である。これは、クラス間を区別するモデルの能力を示す、分離性の度合いまたは尺度を表す。AUCは0から1の間で、値が大きいほどモデルの性能が優れていることを意味する。AUCが1のモデルは完璧な分類を示し、AUCが0.5のモデルはランダムな推測より良くないことを示す。
AUCはROC(Receiver Operating Characteristic)曲線と本質的に関連している。ROC曲線は、モデルの性能をグラフ化したもので、さまざまな閾値設定における偽陽性率(FPR)に対する真陽性率(TPR)をプロットしたものである。TPRは再現率としても知られ、正しく識別された実際の陽性の比率を測定し、FPRは誤って陽性と分類された実際の陰性の比率を測定します。AUCは、その名前が示すように、このROC曲線下の面積であり、すべての可能なしきい値にわたってモデルのパフォーマンスを要約する単一のスカラー値を提供する。
AUCはいくつかの理由から重要な指標である。第一に、これは閾値不変であり、どのような分類閾値が選択されるかに関係なく、モデルの予測品質を測定することを意味する。これは、偽陽性と偽陰性のコストが変化する場合や、不均衡なデータセットを扱う場合に特に有用である。第二に、AUCは、すべての可能な分類しきい値にわたってモデルのパフォーマンスの包括的なビューを提供し、不均衡なシナリオで誤解を招く可能性のある精度のようなメトリクスよりも、よりニュアンスに富んだ理解を提供します。
AUCは、さまざまな機械学習モデルの性能を評価・比較するために、実世界のさまざまなアプリケーションで使用されている。以下に2つの具体例を示す:
AUCは価値ある指標であるが、他の評価指標との違いを理解することが不可欠である:
AUCは、分類モデルの性能を評価するための強力な指標であり、特に不均衡なデータセットや誤分類のコストが変化するシナリオにおいて有効である。そのしきい値不変の性質と、すべての可能なしきい値にわたる包括的なビューにより、機械学習の実践者のツールキットにおける貴重なツールとなっている。AUC、ROC曲線との関係、およびその応用を理解することで、効果的な機械学習モデルを開発・評価する能力を大幅に向上させることができる。高度なコンピュータ・ビジョン・タスクに取り組む人にとって、以下のようなフレームワークは、モデル開発と評価のための堅牢なツールを提供する。 Ultralytics YOLOのようなフレームワークは、AUCのようなメトリクスを含む、モデル開発と評価のための堅牢なツールを提供します。AIとコンピュータ・ビジョンについてもっと知りたい方は、Ultralytics の用語集をご覧ください。また、 Ultralytics でキャリアを調べることで、最先端のAI開発に携わることもできます。