用語集

リコール

機械学習におけるRecallとは何か、なぜそれが重要なのか、そしてAIモデルが重要なポジティブ・インスタンスを効果的に捕捉するためにはどうすればよいのかを学ぶ。

回収率(Recall)は、感度(Sensitivity)または真陽性率(True positive rate)としても知られ、機械学習(ML)および統計学における基本的な評価指標である。これは、データセット内のすべての関連するインスタンスを正しく識別するモデルの能力を測定する。簡単に言うと、Recallは質問に答える:"実際に陽性であったすべてのインスタンスのうち、モデルはいくつを陽性と正しく予測したか?"Recallスコアが高いということは、モデルが発見すべきものを効果的に発見し、見逃されたポジティブ・ケース(偽ネガティブ)の数を最小化していることを示します。この指標は、陽性ケースの検出に失敗すると重大な結果をもたらすアプリケーションでは特に重要です。

高いリコール率の重要性

多くの実世界のシナリオでは、偽陰性(検出漏れ)のコストは、偽陽性(誤警報)のコストよりもはるかに高い。そこで、高い再現率を優先することが不可欠になります。例えば、医療画像解析や不正検出のようなタスクでは、高Recallモデルは、いくつかの非ケースが誤ってフラグ付けされることを意味するとしても、できるだけ多くの真のケースがさらなるレビューのために捕捉されることを保証します。

  • 医療診断: 医療スキャンから癌を検出するAI搭載システムでは、高いRecallモデルが重要である。がん腫瘍を見逃して(偽陰性)救命治療を遅らせてしまうより、健康な患者を放射線科医に確認させるためにシステムがフラグを立てる(偽陽性)方がはるかに良い。ヘルスケアソリューションの多くのAIは、高感度に最適化されている。
  • セキュリティと監視侵入者を検知するために設計されたセキュリティアラームシステムでは、高いリコールが最も重要である。たとえ野良動物を侵入者と間違えることがあったとしても、システムは潜在的な脅威をすべて特定しなければならない。正真正銘のセキュリティ侵害を見逃してしまうと、システムの効果がなくなってしまいます。

ウルトラリティクスYOLOモデルのリコール

コンピュータビジョン(CV)やUltralytics YOLOのようなモデルの文脈では、RecallはPrecisionや平均平均精度(mAP)と並んで、物体検出や インスタンス分割のようなタスクの性能を評価するために使用される重要な指標である。RecallとPrecisionの良好なバランスを達成することは、多くの場合、ロバストな実世界のパフォーマンスにとって不可欠です。例えば、YOLOv8とYOLO11のようなモデルを比較する場合、Recallは各モデルがどの程度すべてのターゲットオブジェクトを識別するかを理解するのに役立ちます。ユーザーは、PyTorchや TensorFlowのようなフレームワークを使用してカスタムモデルをトレーニングし、Weights & BiasesのようなツールやUltralytics HUBの統合機能を使用してRecallを追跡することができます。Recallを理解することは、ハイパーパラメータのチューニングやYOLOv10や最新のYOLO11のような異なるモデルアーキテクチャの探索を含む可能性のある、特定のユースケースにモデルを最適化するのに役立ちます。Ultralyticsのドキュメントのようなリソースは、トレーニングと評価に関する包括的なガイドを提供しています。

リコールとその他の指標

Recallを他の一般的な評価指標と区別することは重要である。

  • 精度:Recallがすべての肯定的なサンプルを見つけることに焦点を当てるのに対し、Precisionは行われた肯定的な予測の正確さを測定します。それに答えます:"モデルが陽性と予測したすべてのインスタンスのうち、実際に陽性であったのは何個か?" に答えます。PrecisionとRecallの間にはしばしばトレードオフがあり、一方を上げるともう一方が下がることがある。この概念は、Precision-Recall tradeoffとして知られている。
  • 精度:全体的な予測の正答率(正負両方)を測定する。一方のクラスが他方を大きく上回っているような不均衡なデータセットでは、精度は誤解を招きやすい指標となり得る。例えば、99%がネガティブなサンプルのデータセットでは、すべてをネガティブと予測するモデルは99%の精度を達成するが、ポジティブ・クラスのRecallはゼロである。
  • F1-スコア:これはPrecisionとRecallの調和平均である。F1-Scoreは両方のメトリクスのバランスをとる単一の数値を提供し、偽陽性と偽陰性の両方を考慮する必要がある場合に有用な指標となる。クラス分布が不均一な場合によく使われます。
  • 曲線下面積(AUC):特にバイナリ分類の場合、ROC(Receiver Operating Characteristic)曲線は、偽陽性率に対する真陽性率(Recall)をプロットします。AUCは、すべての分類しきい値にわたるモデルのパフォーマンスを要約する単一のスコアを提供します。Precision-Recall曲線の下の面積(AUC-PR)は,不均衡な分類タスクでは,しばしばより有益である.

Ultralyticsコミュニティに参加する

AIの未来に参加しませんか。世界のイノベーターとつながり、協力し、成長する

今すぐ参加する
クリップボードにコピーされたリンク