機械学習におけるRecallとは何か、なぜそれが重要なのか、そしてAIモデルが重要なポジティブ・インスタンスを効果的に捕捉するためにはどうすればよいのかを学ぶ。
回収率(Recall)は、感度(Sensitivity)または真陽性率(True positive rate)としても知られ、機械学習(ML)および統計学における基本的な評価指標である。これは、データセット内のすべての関連するインスタンスを正しく識別するモデルの能力を測定する。簡単に言うと、Recallは質問に答える:"実際に陽性であったすべてのインスタンスのうち、モデルはいくつを陽性と正しく予測したか?"Recallスコアが高いということは、モデルが発見すべきものを効果的に発見し、見逃されたポジティブ・ケース(偽ネガティブ)の数を最小化していることを示します。この指標は、陽性ケースの検出に失敗すると重大な結果をもたらすアプリケーションでは特に重要です。
多くの実世界のシナリオでは、偽陰性(検出漏れ)のコストは、偽陽性(誤警報)のコストよりもはるかに高い。そこで、高い再現率を優先することが不可欠になります。例えば、医療画像解析や不正検出のようなタスクでは、高Recallモデルは、いくつかの非ケースが誤ってフラグ付けされることを意味するとしても、できるだけ多くの真のケースがさらなるレビューのために捕捉されることを保証します。
コンピュータビジョン(CV)やUltralytics YOLOのようなモデルの文脈では、RecallはPrecisionや平均平均精度(mAP)と並んで、物体検出や インスタンス分割のようなタスクの性能を評価するために使用される重要な指標である。RecallとPrecisionの良好なバランスを達成することは、多くの場合、ロバストな実世界のパフォーマンスにとって不可欠です。例えば、YOLOv8とYOLO11のようなモデルを比較する場合、Recallは各モデルがどの程度すべてのターゲットオブジェクトを識別するかを理解するのに役立ちます。ユーザーは、PyTorchや TensorFlowのようなフレームワークを使用してカスタムモデルをトレーニングし、Weights & BiasesのようなツールやUltralytics HUBの統合機能を使用してRecallを追跡することができます。Recallを理解することは、ハイパーパラメータのチューニングや、YOLOv10や最新のYOLO11のような異なるモデルアーキテクチャの探索を含む可能性のある、特定のユースケースにモデルを最適化するのに役立ちます。Ultralyticsのドキュメントのようなリソースは、トレーニングと評価に関する包括的なガイドを提供しています。
Recallを他の一般的な評価指標と区別することは重要である。