機械学習における精度の重要性、その計算方法、不均衡なデータセットにおける限界、モデルのパフォーマンスを向上させる方法を発見してください。
精度は、機械学習(ML)、特に分類タスクにおける基本的な性能指標である。これは、モデルが正しく識別した予測全体の割合を測定します。簡単に言えば、質問に答えるものです:"すべての予測のうち、いくつが実際に正しかったか?" という質問に答えるものです。これは、与えられたデータセットにおけるモデルの全体的な性能の、わかりやすくハイレベルな概要を提供する。
精度は、正しい予測(真陽性と真陰性の両方)の数を、行われた予測の総数で割ることによって計算される。直感的ではあるが、特に不均衡なデータセット(あるクラスが他のクラスより著しく多い状況)を扱う場合、精度だけでは誤解を招くことがある。例えば、あるデータセットに95%の非スパムメールと5%のスパムメールが含まれる場合、全てのメールに対して「スパムではない」と予測するだけのモデルは、実際のスパムを特定するのには役に立たないにもかかわらず、95%の精度を達成することになります。従って、モデルのパフォーマンスを完全に把握するためには、他の評価指標と共に精度を考慮することが重要です。モデルの評価と微調整戦略について、より多くの洞察を得ることができます。
正確さと関連する指標を区別することが重要だ:
これらのメトリクスは、各クラスの正しい分類と間違った分類の詳細な内訳を提供するコンフュージョン・マトリクスから導き出されることが多い。これらのYOLO パフォーマンス測定基準を理解することは不可欠です。
精度は、多くのアプリケーションでベースライン指標として機能する:
Ultralytics エコシステムでは、精度は、特に画像分類タスクでモデルのパフォーマンスを評価するために使用されるいくつかのメトリクスの1つです。YOLO11 YOLOv8ようなモデルを比較する場合、ImageNetのような標準的なデータセット上の精度ベンチマークは、推論速度や計算コストと並んで、貴重な比較ポイントを提供します。しかし、検出やセグメンテーションのタスクでは、mAPのようなメトリクスが優先されます。