機械学習において、リコールは、特に分類タスクにおいて、モデルの性能を評価するために使用される重要な指標である。これは、データセット中のすべての関連するインスタンスを識別するモデルの能力を測定する。リコールは、医療診断やセキュリティシステムのように、正のインスタンスを見逃すと深刻な結果を招く可能性があるシナリオにおいて特に重要である。
回収率(Recall)は、感度(Sensitivity)または真陽性率(True positive rate)としても知られ、実際の陽性の総数のうち、真陽性の割合として定義される。基本的に、これはデータセットから関連するすべてのインスタンスを検索するモデルの能力を反映する。リコールが高いということは、モデルが陽性インスタンスのほとんどを識別できることを示し、一方リコールが低いということは、多くの関連するケースが見逃されていることを示す。
医療現場では、病気を持つ患者を正しく識別するために、想起が不可欠である。例えば、癌の検出では、真陽性(癌に罹患している患者)を見逃すと、深刻な健康被害につながる可能性がある。偽陰性を最小限に抑えるためには、高い想起率を持つシステムが好まれる。
リコールは、侵入検知システムのようなセキュリティ・アプリケーションにおいて極めて重要である。リコールが低いシステムは、いくつかのセキュリティ侵害を検出できない可能性があり、深刻な脆弱性につながる可能性があります。
再現率は、モデル評価におけるもう1つの重要な指標である精度と一緒に議論されることが多い。リコールがすべての関連するインスタンスを識別することに重点を置くのに対して、精度はモデルによってなされた正の予測の精度を測定する。モデルは、多くの否定的なインスタンスを肯定的であると誤ってラベル付けする場合、精度が低くても高い想起を持つことができます。精度についてのより深い理解については、Ultralytics 用語集「精度」をご覧ください。
F1スコアはリコールと精度のバランスをとるために一般的に使用され、両方の側面を考慮した単一の指標を提供する。F1スコアは、精度と想起の調和平均であり、モデルのパフォーマンスのより包括的なビューを提供します。F1スコアの詳細はこちら。
混同行列は、真陽性、偽陽性、真陰性、偽陰性を表示することで、想起を視覚化するのに役立ちます。この行列は、モデルがどこでエラーを起こしているかもしれないかという洞察を提供します。混同行列を探求して、その構造と応用を理解しましょう。
Receiver Operating Characteristic(ROC)曲線は、モデルのリコール対偽陽性率のグラフ表現である。二値分類問題で最適な閾値を選択するのに役立ちます。AIにおけるROC曲線で、ROC曲線の詳細をご覧ください。
ヘルスケアにおけるAIモデル、例えば病気の検出に使われるものは、診断の見落としを最小限にするために、高い想起率に大きく依存する。例えば放射線学では、AIは医療画像の精度と効率を高めることができる。
農業では、害虫の検出にAIを使用すると、深刻な作物被害につながる可能性のある蔓延に気づかれないようにするために、高い想起が必要となります。AIが農業にどのような変革をもたらすかについては、農業AIをご覧ください。
リコールは機械学習モデルの評価において重要な指標であり、特に関連するインスタンスをすべて特定することが重要である。精度やF1スコアのような他の指標とともに、リコールを包括的に理解することは、ロバストなモデルを構築するために不可欠です。AIモデルとそのパフォーマンスについてもっと知りたい方のために、Ultralytics ブログでは、実際のAIアプリケーションについての洞察を提供しています。