用語集

損失関数

AI/MLにおける損失関数の役割、その種類、実際のアプリケーションをご紹介します。正確な予測のためにモデルを最適化します。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

人工知能(AI)や機械学習(ML)の領域では、モデルの学習において損失関数が重要な役割を果たす。これは、アルゴリズムがデータセットをどれだけうまくモデル化できたかを評価する方法である。予測が完全に外れた場合、損失関数はより高い数値を出力する。もし予測がかなり良ければ、損失関数は低い数値を出力する。モデルを改善するためにアルゴリズムの一部を変更すると、損失関数が、うまくいっているかどうかを教えてくれる。学習プロセスにおける主な目標は、損失関数を最小化することであり、これはモデルのパラメータを最適化し、可能な限り正確な予測を行うことを意味する。

損失関数の重要性

損失関数は、機械学習モデルの学習という抽象的な目標を、具体的で測定可能な目的に変換するため、不可欠である。損失関数は、最適化アルゴリズムがモデルのパラメータを調整する際の指針となる、定量化可能な指標を提供する。明確に定義された損失関数がなければ、学習プロセスの方向性が定まらず、最適なパフォーマンスを達成することはほぼ不可能となる。適切な損失関数を選択することも、モデルがデータから効果的に学習する能力に直接影響するため、非常に重要です。

損失関数の種類

機械学習タスクの種類によって、必要とされる損失関数は異なる。以下は一般的な例である:

  • 回帰タスクの場合:これらのタスクは、連続出力変数の予測を含みます。回帰でよく使われる損失関数には、平均絶対誤差(MAE: Mean Absolute Error)と平均2乗誤差(MSE: Mean Squared Error)があります。これらの関数は、予測値の集合における誤差の平均の大きさを測定しますが、その方向は考慮しません。
  • 分類タスクの場合:これらのタスクは、カテゴリ出力変数の予測を伴います。分類でよく使われる損失関数には、バイナリ・クロスエントロピー(バイナリ分類問題用)とカテゴリ・クロスエントロピー(マルチクラス分類問題用)がある。クロス・エントロピーの損失は、予測確率が実際のラベルから乖離するにつれて増加します。
  • オブジェクト検出タスク:これらのタスクは、画像内のオブジェクトを分類するだけでなく、バウンディングボックスを予測することによって、オブジェクトの位置を特定する必要があります。モデルで使用されるような特殊な損失関数 Ultralytics YOLOモデルで使用されるような特殊な損失関数は、分類損失とローカライズ損失を組み合わせて、物体の正確な検出とローカライズにおけるモデルのパフォーマンスを最適化します。物体検出についてさらに詳しく

実世界での応用

損失関数は、実際のAI/MLアプリケーションで幅広く使用されています。以下に2つの例を挙げます:

  1. 医療診断:MRI検査における腫瘍検出などの医療画像診断では、損失関数は腫瘍を正確に識別・セグメント化するモデルの学習に役立つ。損失関数を最小化することで、モデルは健康な組織とがん組織を高い精度で区別することを学習し、診断精度と患者の転帰を改善します。ヘルスケアにおけるAIの詳細については、こちらをご覧ください。
  2. 自律走行車:自動運転車は、歩行者、他の車両、交通標識の検出など、環境を認識するためにコンピュータビジョンモデルに依存しています。損失関数はこれらのモデルのトレーニングをガイドし、安全なナビゲーションに不可欠な、物体の正確な識別と位置特定をリアルタイムで行えるようにします。自動運転におけるAIの詳細については、こちらをご覧ください。

他のキーコンセプトとの関係

損失関数は、機械学習における他のいくつかの重要な概念と密接に関連している:

結論

損失関数は、効果的な機械学習モデルをトレーニングするための基本である。損失関数は、最適化プロセスを導く明確で測定可能な目的を提供し、モデルがデータから学習して正確な予測を行うことを可能にする。様々なタイプの損失関数とその応用を理解することは、AIやMLの分野で働く人にとって不可欠です。関連する概念やツールの詳細については、Ultralytics ブログと Ultralytics HUB プラットフォームをご覧ください。 HUB プラットフォームでは、最先端のコンピュータビジョンモデルをトレーニングおよびデプロイするためのリソースやソリューションを提供しています。

すべて読む