曲線下面積(AUC)は、機械学習や人工知能における二値分類モデルの性能を評価する上で重要な指標である。これは、様々な閾値設定における偽陽性率に対する真陽性率をプロットしたROC(Receiver Operating Characteristic)曲線の下の面積を表す。AUCは、クラス間を区別するモデルの能力を要約する単一のスカラー値を提供するので、特に価値がある。
AUCは、正例と負例を正しく分類するモデルの全体的な能力を定量化する。AUCは0から1の範囲で、0.5のAUCは識別能力がないことを示唆し、ランダムな推測に相当し、1のAUCは完全な分類を示す。AUCは一般に、クラス分布に不均衡がある状況でモデルを評価するために使用される。
Accuracyや Precisionのような他の分類指標とは異なり、AUCは正と負の予測がなされる閾値に影響されない。この特徴により、特に一方のクラスが他方のクラスを大きく上回るような不均衡なクラスを持つデータセットに対して、AUCは頑健な指標となる。
AUCは、モデルの性能を評価するために様々なアプリケーションで頻繁に使用される:
ヘルスケア医療診断では、AUCは病気の有無を予測するモデルの評価に使用され、スクリーニングプログラムにおける診断精度の向上に役立っている。詳しくは、AI in Healthcareをご覧ください。
不正検出:AUCは、トランザクションまたはID検証における不正行為を識別するように設計されたモデルを評価するのに役立ち、検出の有効性についてバランスの取れた尺度を提供する。
医療画像放射線医学では、MRIやCTスキャンで腫瘍を検出する深層学習モデルの性能を測定するためにAUCが採用されている。このようなモデルが画像を癌または非癌として正しく分類する能力は、早期診断において極めて重要です。放射線学におけるAIの影響についてもっと知る。
金融サービスクレジットスコアリングにおいて、AUCは貸し倒れの可能性を予測するモデルを評価するために使用される。ここで高いAUCを達成することで、より良いリスク評価と意思決定プロセスが保証される。金融におけるAIでさらに詳しくご覧ください。
AUCを向上させるために、機械学習の専門家は、モデルの学習を強化する新しい入力変数を作成するフィーチャーエンジニアリングや、モデルのパフォーマンスを最適化するハイパーパラメータチューニングのようなテクニックに取り組むことが多い。
AUCは、クラスの不均衡が懸念されるモデルを評価するための重要な指標である。AUCは、モデルの分類能力に関する包括的な洞察を提供し、より単純なメトリクスの限界を超えます。AUCと関連する概念についてさらに調べるには、Ultralytics HUBをご覧ください。このHUBでは、ロバストなAIモデルを開発・展開するためのツールやリソースを提供しています。
AUCがどのようにモデル評価に結びついているかをより深く理解するために、ROC曲線の構築と解釈についてのより詳細な情報を提供するROC曲線(Receiver Operating Characteristic)の用語集もご覧ください。