用語集

F1スコア

機械学習におけるF1スコアの重要性を知る!最適なモデル評価のために、精度と想起のバランスをどのようにとるかを学びましょう。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

F1スコアは機械学習、特に分類モデルの性能を評価する際に重要な指標である。F1-Scoreは、モデルの精度と想起のバランスの取れた指標であり、不均衡なデータセットを扱う際に特に有用である。F1-Scoreを理解することは、人工知能や機械学習に携わる人にとって不可欠です。F1-Scoreは、精度だけでなく、モデルの性能についてより微妙な視点を提供してくれるからです。

F1スコアを理解する

F1-Scoreはprecisionとrecallの調和平均である。F1-Scoreを理解するためには、まず精度と想起の概念を把握することが重要である。精度は、ポジティブな予測の正確さを測定し、ポジティブに予測されたインスタンスのどの割合が実際にポジティブであったかを示します。精度が高いということは、モデルが肯定的な結果を予測したとき、それが正しい可能性が高いことを意味します。一方、Recall は、陽性の予測の完全性を測定し、実際の陽性のインスタンスのどの比率がモデルによって正しく識別されたかを示します。高いリコールは、モデルがほとんどの肯定的な事例を効果的に識別していることを意味します。

F1-Scoreは、これらの2つのメトリクスを1つのスコアに統合し、特にクラスが不均等に分布している場合に、分類器の性能のバランスの取れたビューを提供します。高いF1-Scoreは、モデルが高い精度と高いリコールの両方を持つことを示します。これは、Ultralytics YOLO モデルを使った物体検出のようなシナリオで特に価値があります。このシナリオでは、物体を正確に検出すること(精度)と、画像に存在する物体のすべてのインスタンスを見つけること(再現性)の両方が重要です。

関連性と使用例

F1-Scoreは、AIやMLの様々なアプリケーションで広く使用されており、特にデータセットのバランスが悪い場合や、偽陽性と偽陰性の両方に大きなコストがかかる場合に使用される。実際の例をいくつか紹介しよう:

  • 医療診断:腫瘍検出のような医療画像解析では、腫瘍を見逃すこと(低リコール)は、良性組織を誤って癌と識別すること(低精度)と同じくらい重大な場合があります。F1-Scoreは、診断モデルが病気を検出するのに十分な感度と、誤報を最小化するのに十分な精度の両方を保証することで、これらの懸念のバランスをとるのに役立ちます。例えば、Ultralytics YOLO11 in Medical Imagingを用いた脳腫瘍検出では、F1-Scoreが高ければ信頼性の高い診断が可能な頑健なモデルであることを示す。
  • セキュリティシステム 盗難防止のためにコンピュータ・ビジョンによって強化されたようなセキュリティ警報システムでは、F1-Scoreが極めて重要である。高い想起率を持つシステムは、ほとんどのセキュリティ脅威を確実に検出し、高い精度は、ユーザーを鈍感にさせたり、リソースを浪費させたりする誤報を最小限に抑えます。NVIDIA Jetsonのようなプラットフォーム上でリアルタイム・セキュリティ・アプリケーション用に展開されるモデルは、信頼性が高く効率的なパフォーマンスを達成するために、F1-Score最適化の恩恵を受けています。

F1スコアと他の指標

精度は一般的な指標であるが、不均衡なデータセットでは誤解を招く可能性がある。例えば、不正取引がまれな不正検知システムにおいて、あるモデルは単に「不正はない」とほとんどの時間予測することで、高い精度を達成することができる。しかしこのモデルは、実際の不正ケースを検出できず、リコールやF1-Scoreが低い可能性が高い。

このようなシナリオでは、F1-Scoreは精度と想起の両方を考慮することで、より有益な評価を提供します。モデルの精度が高くてもF1-Scoreが低ければ、それは精度と想起のアンバランスを示唆し、モデルが少数クラスを効果的に処理していないことを示すことが多い。したがって、特に Ultralytics YOLO 、 画像分類による 物体検出のようなタスクでモデルを評価する場合、平均平均精度(mAP)やIntersection over Union(IoU)のような他のメトリクスとともにF1-Scoreを考慮することで、モデルのパフォーマンスをより包括的に理解することができます。Ultralytics 、最適なモデルの選択とチューニングを確実にするために、これらのYOLO パフォーマンスメトリクスを評価するためのツールとガイドを提供します。関連するメトリクスのさらなる探求については、F1-Scoreに関する scikit-learn のドキュメントのようなリソースが、詳細な洞察を提供しています。

すべて読む