機械学習におけるRecallとは何か、なぜそれが重要なのか、そしてAIモデルが重要なポジティブ・インスタンスを効果的に捕捉するためにはどうすればよいのかを学ぶ。
リコールは、機械学習や統計学における重要なパフォーマンス指標であり、特に分類や情報検索タスクにおいて重要である。データセットからすべての関連するインスタンスを正しく識別するモデルの能力を測定する。感度または真陽性率(TPR)としても知られるRecallは、次の質問に答えます:"実際に陽性であったすべてのインスタンスのうち、モデルはいくつを陽性と正しく予測したか?" という質問に答えます。高いRecallは、ポジティブ・インスタンス(False Negative)の見逃しが重大な結果をもたらすシナリオにおいて極めて重要です。
Recallは、データセット内の実際の陽性のケースに注目し、そのうちのいくつがモデルによってうまく捕捉されたかを定量化する。これは、TP(True Positives:真陽性)と FN(False Negatives:偽陰性)の合計(True Positives と False Negatives:実際には陽性だが誤って陰性と識別されたインスタンス)に対する、TP(True Positives:真陽性)と FN(False Negatives:偽陰性)の比率として計算される。Recallが高いモデルは、ほとんどのポジティブ・インスタンスを正しく識別する。Recallを理解することは、モデルのパフォーマンスを評価するために不可欠であり、しばしばConfusion Matrixを用いて可視化される。
RecallはしばしばPrecisionと並んで議論される。Recallが実際に正しく識別された陽性の割合を測定するのに対して、Precisionは予測された陽性のうち実際に正しかったものの割合(TP / (TP + False Positives))を測定する。Recallを優先するかPrecisionを優先するかは、特定のアプリケーションに依存します:
F1スコアは、PrecisionとRecallの両方をバランスさせる単一の指標を提供する。
リコールは多くの分野で重要な評価指標である:
コンピュータビジョンでは、物体検出や 画像セグメンテーションのようなタスクを評価するためにリコールが不可欠である。物体検出モデル Ultralytics YOLOのような物体検出モデルでは、Recallは、モデルが画像内の特定の物体クラスのすべてのインスタンスをどの程度検出できるかを示します。Recallが高いということは、モデルが検出すべきオブジェクトをほとんど見逃さないことを意味します。これは、YOLO パフォーマンスメトリクスのガイドで詳しく説明されているように、検出パフォーマンスの包括的な評価を提供するために、精度および平均平均精度(mAP)と並んで一般的に使用されます。Ultralytics HUBのようなプラットフォーム内のツールは、ユーザーがモデルのトレーニングと検証中にこれらのメトリクスを追跡するのに役立ちます。Recallを理解することは、セキュリティアラームシステムにおける包括的な検出を確実にするなど、開発者が特定のニーズに合わせてモデルを微調整するのに役立ちます。パフォーマンスを評価するには、多くの場合、混同行列から得られるメトリクスを分析し、潜在的に不均衡なデータセットのコンテキストを考慮する必要があります。