用語集

リコール

機械学習におけるRecallとは何か、なぜそれが重要なのか、そしてAIモデルが重要なポジティブ・インスタンスを効果的に捕捉するためにはどうすればよいのかを学ぶ。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

リコールは、機械学習や統計学における重要なパフォーマンス指標であり、特に分類や情報検索タスクにおいて重要である。データセットからすべての関連するインスタンスを正しく識別するモデルの能力を測定する。感度または真陽性率(TPR)としても知られるRecallは、次の質問に答えます:"実際に陽性であったすべてのインスタンスのうち、モデルはいくつを陽性と正しく予測したか?" という質問に答えます。高いRecallは、ポジティブ・インスタンス(False Negative)の見逃しが重大な結果をもたらすシナリオにおいて極めて重要です。

コアコンセプト

Recallは、データセット内の実際の陽性のケースに注目し、そのうちのいくつがモデルによってうまく捕捉されたかを定量化する。これは、TP(True Positives:真陽性)と FN(False Negatives:偽陰性)の合計(True Positives と False Negatives:実際には陽性だが誤って陰性と識別されたインスタンス)に対する、TP(True Positives:真陽性)と FN(False Negatives:偽陰性)の比率として計算される。Recallが高いモデルは、ほとんどのポジティブ・インスタンスを正しく識別する。Recallを理解することは、モデルのパフォーマンスを評価するために不可欠であり、しばしばConfusion Matrixを用いて可視化される。

リコール対精度精度

RecallはしばしばPrecisionと並んで議論される。Recallが実際に正しく識別された陽性の割合を測定するのに対して、Precisionは予測された陽性のうち実際に正しかったものの割合(TP / (TP + False Positives))を測定する。Recallを優先するかPrecisionを優先するかは、特定のアプリケーションに依存します:

  • 正のインスタンス(偽陰性)を見逃すコストが高い場合は、高い回収率が好まれる
  • 陰性インスタンスを陽性と誤って識別するコスト(False Positive)が高い場合、高精度が好まれる

F1スコアは、PrecisionとRecallの両方をバランスさせる単一の指標を提供する。

実世界での応用

リコールは多くの分野で重要な評価指標である:

  • 医療画像解析 AIを使った腫瘍検出のようなタスクでは、高い再現性が不可欠です。悪性腫瘍を見逃すと(偽陰性)、治療が遅れ、深刻な結果を招く可能性がある。そのため、診断システムは、たとえ良性の症例にフラグを立ててさらに検討することになっても(Precisionが低い)、高いSensitivity(Recall)に最適化されることが多い。包括的な検出を保証することは、ヘルスケアにおけるAIにおいて最も重要である。
  • 不正検知不正な金融取引を検知するシステムを構築する場合、Recallを最大化することが重要です。不正取引を識別できなかった場合(False Negative)、大きな金銭的損失につながる可能性があります。誤警報(False Positives)を最小化することも望ましいですが、ほとんどの不正行為を確実に検知することが優先されることがよくあります。

コンピュータ・ビジョンにおける関連性

コンピュータビジョンでは物体検出や 画像セグメンテーションのようなタスクを評価するためにリコールが不可欠である。物体検出モデル Ultralytics YOLOのような物体検出モデルでは、Recallは、モデルが画像内の特定の物体クラスのすべてのインスタンスをどの程度検出できるかを示します。Recallが高いということは、モデルが検出すべきオブジェクトをほとんど見逃さないことを意味します。これは、YOLO パフォーマンスメトリクスのガイドで詳しく説明されているように、検出パフォーマンスの包括的な評価を提供するために、精度および平均平均精度(mAP)と並んで一般的に使用されます。Ultralytics HUBのようなプラットフォーム内のツールは、ユーザーがモデルのトレーニングと検証中にこれらのメトリクスを追跡するのに役立ちます。Recallを理解することは、セキュリティアラームシステムにおける包括的な検出を確実にするなど、開発者が特定のニーズに合わせてモデルを微調整するのに役立ちます。パフォーマンスを評価するには、多くの場合、混同行列から得られるメトリクスを分析し、潜在的に不均衡なデータセットのコンテキストを考慮する必要があります。

すべて読む