ロバストな実世界アプリケーションのための信頼できるポジティブな予測を保証する重要な指標である、AIにおける「精度」の重要性をご覧ください。
精度は機械学習(ML)や統計的分類における基本的な評価指標であり、特にコンピュータビジョン(CV)のような分野では重要である。これは、正と予測されたすべてのインスタンスの中で、真の正予測の割合を測定します。より簡単に言えば、モデルが何かを特定のクラスに属すると予測するとき(例えば、物体を「車」と識別する)、精度はその予測が実際に正しい頻度を示します。これは質問に答えます:「正のクラスに対して行われたすべての予測のうち、いくつが本当に正であったか?
精度(Precision)は、特にモデルによる陽性予測に焦点を当てる。これは、真陽性(正しく識別された陽性インスタンス)の数を、真陽性と偽陽性(誤って陽性と識別されたインスタンス)の合計で割ることによって計算される。高精度のスコアは、モデルがほとんど誤検出をしないことを示し、つまり、モデルが陽性の結果を予測するとき、それが正しい可能性が高いことを意味する。この指標は、偽陽性のコストが高いアプリケーションでは非常に重要です。例えば、スパムメール検出では、精度が高ければ、重要なメールが誤ってスパムと分類される可能性が低くなります。
精度は、しばしばリコール(感度としても知られる)と並んで議論される。精度が陽性予測の精度を測定するのに対して、想起はすべての実際の陽性インスタンスを識別するモデルの能力を測定します(真陽性÷(真陽性+偽陰性))。多くの場合、精度と想起の間にはトレードオフがあり、一方を向上させると他方が低下する可能性があります。この関係はPrecision-Recall曲線を用いて可視化することができる。
精度と正確さを区別することも重要です。Accuracyはすべてのクラス(ポジティブとネガティブの両方)にわたってモデルの全体的な正しさを測定しますが、Precisionはポジティブ予測の正しさだけに焦点を当てます。アンバランスなクラスを持つデータセットでは、精度は誤解を招く可能性があり、一方精度は正のクラスに関する性能についてより具体的な洞察を提供する。F1-Scoreは、PrecisionとRecallの間のバランスを提供する。
様々なAIアプリケーションにおいて、精度は非常に重要な指標である:
精度を理解し最適化することで、開発者は特定のニーズに合わせてモデルのパフォーマンスを調整することができます。Ultralytics HUBのようなツールは、開発サイクル中に精度のようなメトリクスを追跡しながら、ユーザーがモデルをトレーニングし、評価するのに役立ちます。