用語集

精度

機械学習における精度の重要性、その計算方法、不均衡なデータセットにおける限界、モデルのパフォーマンスを向上させる方法を発見してください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

精度は、機械学習(ML)、特に分類タスクにおける基本的な性能指標である。これは、モデルが正しく識別した予測全体の割合を測定します。簡単に言えば、質問に答えるものです:"すべての予測のうち、いくつが実際に正しかったか?" という質問に答えるものです。これは、与えられたデータセットにおけるモデルの全体的な性能の、わかりやすくハイレベルな概要を提供する。

正確さを理解する

精度は、正しい予測(真陽性と真陰性の両方)の数を、行われた予測の総数で割ることによって計算される。直感的ではあるが、特に不均衡なデータセット(あるクラスが他のクラスより著しく多い状況)を扱う場合、精度だけでは誤解を招くことがある。例えば、あるデータセットに95%の非スパムメールと5%のスパムメールが含まれる場合、全てのメールに対して「スパムではない」と予測するだけのモデルは、実際のスパムを特定するのには役に立たないにもかかわらず、95%の精度を達成することになります。従って、モデルのパフォーマンスを完全に把握するためには、他の評価指標と共に精度を考慮することが重要です。モデルの評価と微調整戦略について、より多くの洞察を得ることができます。

精度とその他の指標

正確さと関連する指標を区別することが重要だ:

  • 精度実際に正しい識別の割合を測定する。これは答えである:"陽性と予測されたすべての項目のうち、いくつが本当に陽性であったか?"偽陽性のコストが高い場合、高精度は極めて重要である。
  • Recall(感度):正しく識別された実際の陽性の割合を測定する。これは答えである:"すべての真陽性項目のうち、モデルはいくつを正しく識別できたか?"陽性症例(偽陰性)を見逃すとコストがかかる場合は、高い再現性が不可欠である。
  • F1スコアPrecisionとRecallの調和平均で、両方のメトリクスのバランスをとる単一のスコアを提供する。不均衡なクラスを扱うときに特に有用。
  • 平均平均精度(mAP)で実行されるような物体検出タスクで一般的な指標。 Ultralytics YOLOモデルで実行されるような物体検出タスクで一般的な指標で、分類の正しさとローカライズの精度(Intersection over Union - IoU)の両方を考慮します。単純な精度はバウンディングボックスの配置を考慮していないため、ここでは適していません。

これらのメトリクスは、各クラスの正しい分類と間違った分類の詳細な内訳を提供するコンフュージョン・マトリクスから導き出されることが多い。これらのYOLO パフォーマンス測定基準を理解することは不可欠です

実際の応用と例

精度は、多くのアプリケーションでベースライン指標として機能する:

  1. スパムメールのフィルタリングメールを「スパム」か「スパムでない」かに分類する際、精度は正しく分類されたメールの全体的な割合を示します。しかし、一般的にスパムメールの割合が低いため(データセットの不均衡の問題)、精度のみに頼ることは欺瞞になりかねません。正規のメールに誤ったフラグを立てることなくスパムを確実に捕捉するためには、精度や想起のような指標の方がより有益であることが多いのです。
  2. 医療画像分析 医療スキャン画像を腫瘍がある(「陽性」)かない(「陰性」)かを分類するように設計された、ヘルスケアにおけるAIモデルを考えてみよう。全体的な精度が重要である一方で、再現性が重要になります。腫瘍の見落とし(偽陰性)は深刻な結果をもたらす可能性があるため、たとえ精度が低くなる(さらなるレビューが必要な偽陽性が増える)としても、モデルができるだけ多くの実際の腫瘍のケースを識別できるようにすることが最も重要です。Ultralytics HUBのようなプラットフォームは、このようなモデルの訓練と評価プロセスの管理に役立ちます。

Ultralytics精度

Ultralytics エコシステムでは、精度は、特に画像分類タスクでモデルのパフォーマンスを評価するために使用されるいくつかのメトリクスの1つです。YOLO11 YOLOv8ようなモデルを比較する場合、ImageNetのような標準的なデータセット上の精度ベンチマークは、推論速度や計算コストと並んで、貴重な比較ポイントを提供します。しかし、検出やセグメンテーションのタスクでは、mAPのようなメトリクスが優先されます。

すべて読む