用語集

損失関数

機械学習における損失関数の役割、その種類、重要性、そしてYOLOや物体検出のような実際のAIアプリケーションをご覧ください。

損失関数は、コスト関数や目的関数としても知られ、機械学習（ML）や深層学習（DL）における基本的な要素である。損失関数は、モデルの予測出力と、与えられたデータに対する実際のグランドトゥルースラベルとの差、つまり「損失」を定量化する。損失関数によって計算された値は、モデルのパフォーマンスがどの程度低いかを示す指標となる。モデルの学習プロセスにおける主な目標は、この値を最小化することであり、それによってモデルの精度と性能を向上させることである。

損失機能の仕組み

トレーニングの各反復中に、モデルはトレーニングデータのバッチを処理し、予測を行う。次に損失関数がこれらの予測値と真のラベルを比較する。損失値が大きいほど不一致が大きく、修正が必要であることを示し、損失値が小さいほどモデルの予測値が実際の値に近いことを示す。

この損失値は、モデルが学習するために必要なシグナルとなるため、非常に重要である。このシグナルは、確率的勾配降下法（SGD）などの最適化アルゴリズムによって、モデルの内部パラメータ、つまりモデルの重みを調整するために使用されます。バックプロパゲーションのプロセスは、これらの重みに対する損失関数の勾配を計算し、損失を減らすために重みを調整すべき方向を示します。損失を計算し、重みを更新するこの繰り返しプロセスにより、モデルは徐々に高精度の予測を行える状態に収束していく。

一般的な損失関数の種類

損失関数の選択は、モデルが解決するために設計された特定のタスクに大きく依存する。問題が異なれば、誤差を測定する方法も異なります。一般的なものには次のようなものがあります：

平均2乗誤差（MSE）：連続的な数値を予測することを目的とする回帰タスクでよく使われる損失関数。予測値と実際値の差の2乗の平均を計算する．
クロスエントロピー損失： 画像分類タスクに広く使用されている。ImageNetデータセットの画像の分類など、複数のクラスを区別するモデルを学習する場合に効果的です。
IoU（Intersection over Union）損失： IoUの変形はオブジェクト検出タスクに不可欠である。GIoU、DIoU、CIoUなどのこれらの損失関数は、予測されたバウンディングボックスとグランドトゥルースボックスの間の不一致を測定します。これらの損失関数は、Ultralytics YOLO11のような正確な物体検出器のトレーニングに不可欠です。
ダイスロス（Dice Loss）: 画像セグメンテーション、特に医用画像解析でよく使われ、予測されたセグメンテーションマスクと実際のセグメンテーションマスクの重なりを測定する。クラスの不均衡を扱うのに特に有効。

実世界での応用

損失関数は、事実上すべてのディープラーニングモデルのトレーニングの中核をなす。

自律走行車： 自律走行車の開発では、歩行者、他の車、交通標識を識別するために物体検出モデルをトレーニングする。ある部分は各オブジェクトを分類する際の誤差を計算し（例：車対歩行者）、別の部分は（多くの場合IoUベースの損失）オブジェクトのバウンディングボックスをローカライズする際の誤差を計算する。この組み合わせによる損失を最小化することで、車載ソリューションにおけるAIの重要な要素である、安全なナビゲーションのためのロバストモデルを作成することができます。
医療診断： ヘルスケアにおけるAIでは、U-Netのようなモデルが、医療スキャンで腫瘍を識別するためのセマンティック・セグメンテーションのために学習される。ダイスロスや、クロスエントロピーとダイスロスの組み合わせのような損失関数が、モデルの予測した腫瘍マスクと、放射線科医が注釈を付けたマスクとを比較するために使用される。医用画像のデータセット上でこの損失を最小化することにより、モデルは病理学的領域を正確に描出することを学習し、より迅速で正確な診断に役立つ。

他のキーコンセプトとの関係

損失関数をMLにおける他の関連概念と区別することは重要である。

損失関数対評価指標：これは極めて重要な違いである。損失関数は最適化プロセスを導くためにトレーニング中に使用される。勾配ベースの学習を可能にするため、微分可能でなければならない。対照的に、Accuracy、Precision、Recall、mean Average Precision (mAP)などの評価指標は、モデルの実世界でのパフォーマンスを評価するために（検証データまたはテストデータ上で）トレーニング後に使用されます。一般的に損失が少ないほど良いメトリクススコアと相関しますが、これらの目的は異なります。パフォーマンス・メトリクスについては、ガイドをご覧ください。
損失関数対最適化アルゴリズム：損失関数は、何を最小化すべきかという目的を定義する。アダム・オプティマイザーのような最適化アルゴリズムは、計算された勾配と学習率に基づいてモデルの重みを更新することで、損失を最小化するメカニズムを定義します。
オーバーフィットとアンダーフィット：トレーニングセットと検証セットの両方の損失を監視することが、これらの一般的な問題を診断する鍵となる。トレーニングの損失が減少し続け、検証の損失が増加し始めた場合、オーバーフィッティングが起こっている可能性が高い。アンダーフィッティングは、両方のセットで損失が大きいことを示します。これらの洞察は、モデルトレーニングのヒントなどのガイドで説明されています。

AIモデルの構築やトレーニングに携わる人にとって、損失関数を理解することは不可欠です。Ultralytics HUBのようなプラットフォームは、この複雑さの多くを抽象化し、損失関数の実装と最適化を自動的に処理するため、高度なコンピュータビジョン（CV）モデルの構築がより身近になります。

損失関数

柔軟なエンタープライズライセンシングソリューションでイノベーションを促進

Ultralytics YOLOでAIモデルを数秒でトレーニング

Ultralytics HUBでYOLOモデルを簡単にトレーニング

損失機能の仕組み

一般的な損失関数の種類

実世界での応用

他のキーコンセプトとの関係

このカテゴリの続きを読む

製造業ERPガイド

製造実行システム（MES）：AI主導の生産

アディティブ・マニュファクチャリングを理解する技術と使用例

Ultralyticsコミュニティに参加する