自動運転やヘルスケアなどのAIアプリケーションにおける物体検出モデルの評価における平均平均精度(mAP)の重要性を発見してください。
平均平均精度(mean Average Precision, mAP)は、一般的なUltralticsのような物体検出モデルの性能を評価するために広く使用されている指標です。 Ultralytics YOLOファミリーのような物体検出モデルの性能を評価するために広く使用されている指標です。mAPは、様々なクラスと信頼レベルにわたって物体を正しく識別し、位置を特定するモデルの能力を要約する単一の包括的なスコアを提供します。より単純なメトリクスとは異なり、mAPは、関連するオブジェクトをすべて見つけること(リコール)と、見つかったオブジェクトが本当に正しいことを確認すること(精度)の間のトレードオフのバランスを効果的にとり、自律システムや医療診断のような複雑なアプリケーションで使用されるモデルを評価する上で非常に重要です。
mAPを理解するには、まずPrecisionと Recallを把握することが不可欠である。物体検出では
mAPは、このトレードオフの異なるポイントにわたってモデルを評価する方法を提供します。WikipediaでPrecisionとRecallの基礎についてもっと知ることができます。
mAPの計算にはいくつかのステップがある。まず、各オブジェクト・クラスについて、モデルの予測を信頼度スコアでソートする。そして、さまざまな信頼度しきい値で精度と想起値を計算することで、精度-想起曲線が生成される。この曲線下の面積(AUC)は、その特定のクラスの平均精度(AP)を与える。最後に、データセット中のすべてのオブジェクト・クラスにわたるAP値を平均することで、mAPが計算される。
多くの場合、mAPは特定のIntersection over Union (IoU)しきい値で報告される。これは、予測されたバウンディング・ボックスがどれだけグラウンド・トゥルースのボックスと重なっているかを測定するものである。一般的なものは以下の通りです:
これらの指標がYOLO モデルにどのように適用されるかの詳細については、YOLO パフォーマンス指標ガイドを参照のこと。
平均平均精度は、オブジェクト検出モデルの性能の全体的なビューを提供するため、非常に重要です。これは、すべてのクラスにわたる分類精度(オブジェクトクラスが正しいか)と定位精度(バウンディングボックスが正しく配置されているか)の両方を考慮します。このため、特に複数のオブジェクト・カテゴリーや不均衡なクラス分布を持つデータセットでは、精度やリコールだけを見るよりも有益です。一般的にmAPスコアが高いほど、よりロバストで信頼性の高いオブジェクト検出モデルであることを示します。mAPを向上させるには、ハイパーパラメータのチューニングや、より良いトレーニングデータの使用といったテクニックが必要になることが多い。
mAPは、精度が最優先される実世界のタスクでモデルを評価する上で非常に重要である:
mAPを関連する評価指標と区別することは重要である:
Ultralytics HUBのようなツールは、ユーザーがモデルを訓練、追跡、評価することを可能にし、重要なパフォーマンス指標としてmAPを目立たせている。フレームワーク PyTorchや TensorFlowなどのフレームワークは、これらのモデルのためのビルディングブロックを提供する。COCOやPASCAL VOCのような標準的なデータセットは、物体検出モデルを比較するための主要なメトリックとしてmAPを使用し、この分野の進歩を推進しています。Ultralytics モデル比較のページでは、mAPで測定されるさまざまなモデルの性能を調べて比較することができます。