用語集

バックプロパゲーション

バックプロパゲーションがどのようにニューラルネットワークを訓練し、エラー率を低減し、画像認識やNLPのようなAIアプリケーションを効率的に強化するかを学ぶ。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

バックプロパゲーションは、「誤差の後方伝播」の略で、人工ニューラルネットワーク、特にディープラーニングの学習に使われる基本的なアルゴリズムだ。これは、ネットワークの各パラメーター(重みとバイアス)が予測の全体的な誤差にどれだけ寄与したかを効率的に計算することで、モデルが失敗から学ぶことを可能にするエンジンだ。この情報は最適化アルゴリズムによって使用され、モデル学習中にパラメータを調整し、モデルのパフォーマンスを長期的に向上させる。

バックプロパゲーションの仕組み

このプロセスには、最初の予測の後、主に2つの段階がある:

  1. フォワード・パス:入力データは、出力(予測)が生成されるまで、ニューロンを活性化し、モデルの重みを適用しながら、層ごとにネットワークに供給される。
  2. 誤差計算:ネットワークの予測値と実際の目標値(グランドトゥルース)の差は、損失関数を用いて計算される。この損失は、予測がどれだけ間違っていたかを定量化します。これを理解するための一般的なリソースは、「Deep Learning Book」のMLPの章です。
  3. バックワードパス:ここでバックプロパゲーションが真に行われる。出力層からスタートし、アルゴリズムは各層のweights and biases 損失関数の勾配を計算する。微積分学の連鎖法則を利用して、エラー信号を効率的にネットワークを介してレイヤーごとに逆伝播する。これにより、全体の誤差を減らすために各パラメータをどれだけ変更する必要があるかが決定される。計算グラフ上の微積分」のような視覚化は、この流れを説明するのに役立つ。
  4. 重みの更新:計算された勾配は、勾配降下法、またはAdamのようなより高度な最適化アルゴリズムによって使用され、ネットワークのweights and biases更新し、次の反復でより良い予測を行うようにモデルを誘導する。

ディープラーニングにおける重要性

バックプロパゲーションは、最新のディープラーニングの成功の基本である。バックプロパゲーションは、コンピューター・ビジョンで広く使われている畳み込みニューラルネットワーク(CNN)や、テキストのようなシーケンシャルなデータに使われるリカレント・ニューラル・ネットワーク(RNN)のような、非常に深く複雑なアーキテクチャーの学習を可能にする。バックプロパゲーションが提供するような勾配を計算する効率的な方法がなければ、このような大規模モデルの学習は計算上不可能である。バックプロパゲーションは、膨大な量のデータから複雑な特徴や関係を自動的に学習することを可能にし、1980年代の普及以来、多くのAIの進歩の基礎を形成してきた。

実世界での応用

バックプロパゲーションは、ディープ・ラーニング・モデルがトレーニングされるときは常に暗黙的に使用される。以下に2つの例を挙げる:

  1. 物体の検出:次のようなモデル Ultralytics YOLOのようなモデルは、バックプロパゲーションを使って学習される。COCOのようなデータセットから、モデルがオブジェクトを誤って識別したり、画像内のバウンディングボックスが不正確に配置された場合、バックプロパゲーションはモデルの重みを調整するために必要な勾配を計算し、オブジェクト検出を正確に実行する能力を向上させる。
  2. 自然言語処理(NLP):機械翻訳や感情分析などのタスクのために、BERTや GPTのような大規模な言語モデルをトレーニングすることは、バックプロパゲーションに大きく依存しています。バックプロパゲーションは、生成されたテキストと希望する出力との差を最小化するようにモデルのパラメータを調整し、これらのモデルが人間のような言語を理解し生成できるようにします。スタンフォード大学のNLPグループは、これらのトピックに関する多くのリソースを提供している。

関連概念

密接に関連しているが、バックプロパゲーションは勾配降下とは異なる。バックプロパゲーションは、特にネットワークのパラメータに対する損失関数の勾配を計算するアルゴリズムである。勾配降下法(およびその亜種)は、これらの計算された勾配を使用してパラメータを反復的に更新し、損失を最小化する最適化アルゴリズムです。バックプロパゲーションは、特に非常に深いネットワークにおいて、消失勾配問題のような問題に悩まされることがあるが、ReLU活性化関数や残差接続を使用するようなテクニックはこれを軽減するのに役立つ。

すべて読む