用語集

損失関数

機械学習における損失関数の役割、その種類、重要性、YOLO や物体検出のような実際のAIアプリケーションについて学ぶ。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

人工知能(AI)や機械学習(ML)において、損失関数はモデル学習時に使用される重要な要素である。損失関数は、モデルの予測値と学習データから得られた実際の真理値との差、つまり「損失」を測定する。損失関数は、モデルが特定のタスクでどの程度劣っているかを定量化するスコアだと考えてください。損失値が高いということは、予測値が大きく外れていることを意味し、損失値が低いということは、予測値が実際の値に近いことを示す。ほとんどの機械学習モデル、特にディープラーニング(DL)のトレーニングの基本的な目標は、この損失関数を最小化することであり、それによってモデルを可能な限り正確で信頼できるものにすることである。

損失関数の重要性

損失関数は、モデル学習プロセスに具体的で定量化可能な目的を提供するため、不可欠である。損失関数は、「データから学習する」という抽象的な目標を、最適化アルゴリズムが最小化できる数学的な値に変換する。この最適化プロセスは、多くの場合、勾配降下や バックプロパゲーションのような技術を使用し、予測誤差を減らす方向にモデルの内部パラメータ(モデルの重み)を反復的に調整するために、損失値に依存します。適切な損失関数の選択は非常に重要であり、回帰分類物体検出などの特定のMLタスクに大きく依存します。誤った損失関数を使用すると、十分なデータと計算リソースがあっても、モデルのパフォーマンスが最適化されない可能性があります。損失関数は、複雑なニューラルネットワーク(NN)の学習プロセスをガイドします。

損失関数の種類

異なる機械学習タスクは、問題の性質と望ましい出力に合わせた異なる損失関数を必要とする。一般的な例としては、以下のようなものがある:

実世界での応用

損失関数は、多くのAIアプリケーションにおけるモデルのトレーニングの基本である:

  1. 医療画像解析腫瘍検出や臓器セグメンテーションの学習モデルでは、ダイスロスやクロスエントロピーのような損失関数が最小化される。これにより、放射線科医が提供するグランドトゥルースのアノテーションに近いセグメンテーションマスクを予測するようモデルを駆動し、ヘルスケアにおけるAIの診断精度に直接影響を与える。
  2. 自律走行車 自動運転車の知覚システムは、損失関数を最小化することによって学習された物体検出モデルを使用する。これらの関数は、安全なナビゲーションと衝突回避のために重要な、道路上の物体の位置(バウンディングボックス)とクラス(歩行者、自動車、自転車)を予測する際のエラーにペナルティを与える。YOLO モデルはここでしばしば採用される。

他のキーコンセプトとの関係

損失関数は、他のいくつかのMLの中核概念と密接に結びついている:

  • 最適化アルゴリズム損失関数は、オプティマイザがナビゲートする「ランドスケープ」を定義する。アダム・オプティマイザーや 確率的勾配降下法(SGD)のようなアルゴリズムは、損失関数の勾配を利用して、学習率に導かれながらモデルの重みを更新します。
  • 評価指標:損失関数とAccuracyPrecisionRecallF1-scoremean Average Precision (mAP)などの評価指標を区別することは非常に重要である。損失関数は最適化プロセスを導くためにトレーニング中に使用されます。勾配ベースの手法が機能するためには微分可能である必要がある。評価メトリクスは、未知のデータ(検証データまたはテストデータ)に対するモデルの実際のパフォーマンスを評価するために、トレーニング後(または検証中)に使用されます。一般的に、損失が小さいほど評価指標のスコアは良くなりますが、これらは測定するものが異なるため、必ずしも直接交換できるわけではありません。例えば、クロスエントロピー損失を最適化することは、精度を向上させることはよくありますが、直接的に精度を最適化するわけではありません。YOLO パフォーマンス・メトリクスについては、こちらをご覧ください。
  • オーバーフィットと アンダーフィットこれらの問題を診断するには、トレーニングセットと別の検証セットの両方の損失を監視することが鍵となる。オーバーフィッティングは、トレーニングの損失が減少し続ける一方で、検証の損失が増加し始める場合に発生する。アンダーフィッティングは、両方のセットで損失が大きいことを示します。これらの問題に対処するための戦略は、「モデルトレーニングのヒント」や「モデル評価の洞察」などのガイドで説明されています。

結論

損失関数は、効果的な機械学習モデルのトレーニングの基礎となるものである。最適化アルゴリズムがモデルのパラメータを調整するために必要なシグナルを提供し、モデルがデータから複雑なパターンを学習し、コンピュータビジョン(CV)やそれ以外の分野の困難なタスクを解決することを可能にします。その目的、利用可能なさまざまなタイプ、評価メトリクスとの関係を理解することは、成功するAIアプリケーションを開発する上で非常に重要です。Ultralytics HUBのようなプラットフォームは、次のような高度なモデルのトレーニングプロセスを合理化します。 Ultralytics YOLO11のような高度なモデルの学習プロセスを合理化し、複雑な損失関数の実装と最適化を裏で処理することで、高度なAIをより身近なものにします。さらに詳しく知りたい方は、Ultralytics ドキュメントをご覧ください。

すべて読む