MLモデル評価における曲線下面積(AUC)の重要性を学びます。AUCの利点、ROC曲線の洞察、実際のアプリケーションをご覧ください。
曲線下面積(AUC)は、機械学習(ML)における分類モデルの有効性を評価するために使用される、広く認知された性能指標である。これは、異なるクラスを区別するモデルの全体的な能力を定量化するもので、可能なすべての分類しきい値にわたってモデルの性能を表す単一のスカラー値を提供する。AUCは、1つのクラスが他のクラスよりも有意に多い、不均衡なデータセットを扱うときに特に有用である。AUCは、モデルの性能をグラフィカルに表現するROC(Receiver Operating Characteristic)曲線と組み合わせて使用されることが多い。
ROC曲線は、AUCを理解するための基本的な概念である。ROC曲線は、様々な閾値設定における真陽性率(TPR)と偽陽性率(FPR)をプロットしたものである。TPRは感度またはリコールとしても知られ、正しく識別された実際の陽性の割合を測定する。FPRは、誤って陽性と分類された実際の陰性の割合を測定します。完全な分類器は、TPRが1、FPRが0となり、すべての陽性と陰性を正しく識別することを意味します。
AUC値は0から1の範囲である:
一般的に、0.8以上のAUCは良好とみなされることが多く、0.9以上のAUCは優れているとみなされる。しかし、「良い」AUCの解釈は、特定の用途や問題の複雑さによって異なることがある。
AUCは文字通りROC曲線下の面積である。ROC曲線は、さまざまな分類しきい値にわたるモデルの真陽性率と偽陽性率のトレードオフを視覚的に描写します。AUCが高いモデルは、ROC曲線がプロットの左上隅に近くなり、すべてのしきい値にわたってより良いパフォーマンスを示します。YOLO Performance Metricsを探求して、同様の評価指標についてより深い洞察を得ましょう。
AUCはパフォーマンス指標としていくつかの利点がある:
AUCは、以下のような様々な実世界のアプリケーションで使用されている:
AUCは価値のある指標ですが、他のパフォーマンス指標と一緒に考えることが重要です。例えば、精度と リコールは、特定のクラスにおけるモデルのパフォーマンスに関する洞察を提供し、F1スコアは精度とリコールのバランスをとる。物体検出で一般的に使用される平均平均精度(mAP)とは異なり、AUCは主に2値分類問題に使用されます。
AUCは、特に不均衡なデータセットを持つシナリオにおいて、分類モデルの性能を評価するための強力な指標である。その閾値不変性、クラスの不均衡に対する頑健性、確率的解釈により、モデルを評価し比較するための貴重なツールとなります。ROC 曲線と AUC 値の意味を理解することで、実務家はモデルのパフォーマンスについてより深い洞察を得ることができ、モデルの選択と最適化について十分な情報に基づいた意思決定を行うことができます。Ultralytics YOLO モデルを次のような様々な形式にエクスポートする方法を学ぶことができます。 ONNX様々なプラットフォーム上で最適化された推論を行うことができます。