用語集

勾配降下

Ultralytics YOLO のようなAIモデルを最適化し、ヘルスケアから自動運転車までのタスクで正確な予測を可能にする勾配降下法をご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

勾配降下は、機械学習(ML)や人工知能(AI)で広く使用されている基本的な最適化アルゴリズムである。以下のような複雑なディープラーニングアーキテクチャを含む、多くのモデルをトレーニングするための主要な方法として機能します。 Ultralytics YOLO.勾配降下の目標は、モデルの内部パラメータweights and biases繰り返し調整して、モデルの予測値と実際の目標値との差を測定する損失関数を最小化することだ。目隠しをした状態で谷の一番低いところを探そうとするのを想像してほしい。勾配降下は、現在地で最も急な下降方向に小さなステップを踏むことであなたを導く。この反復プロセスにより、モデルはデータから学習し、予測精度を向上させることができる。

機械学習における関連性

勾配降下法は、現代の多くのAIアプリケーションの基礎となるニューラルネットワークのような高度なモデルを学習する上で特に重要である。物体検出画像分類自然言語処理(NLP)などに使用されるこれらのモデルは、最適化が必要な数百万のパラメータを持つことが多い。勾配降下とその変種は、複雑な損失ランドスケープをナビゲートし、良好なパフォーマンスをもたらすパラメータ値を見つけるための、計算実行可能な方法を提供します。勾配降下による効果的な最適化がなければ、このような大規模なモデルを高精度に訓練することは現実的ではありません。次のようなフレームワークがあります。 PyTorchTensorFlowのようなフレームワークは、勾配降下の実装に大きく依存しています。

キーコンセプトとバリエーション

勾配降下の核となる考え方は、モデル・パラメータに対する損失関数の勾配(最も急峻に上昇する方向)を計算し、それから反対方向にステップを踏むことである。このステップの大きさは、重要なハイパーパラメータである学習率によって制御される。効率と安定性を向上させるために、いくつかのバリエーションが存在する:

  • バッチ勾配降下:パラメータを更新するたびに、学習データセット全体を使用して勾配を計算する。精度は高いが、大規模なデータセットでは計算コストが高い。
  • 確率的勾配降下(SGD):一度に1つの学習例のみから計算された勾配を使用してパラメータを更新します。より高速ですが、更新にノイズが入ります。
  • ミニバッチ勾配降下法:少量の学習例を用いて勾配を計算する妥協案。計算効率と更新の安定性のバランスをとり、実際に使用される最も一般的なバリエーションである。Wikipediaの勾配降下法についてもっと知る。
  • アダム・オプティマイザー:適応学習率最適化アルゴリズムで、異なるパラメータに対して個別に適応学習率を計算し、しばしば収束を早める。MomentumやRMSpropのような他のオプティマイザーのアイデアを組み合わせている。多くの最先端モデルはアダムや類似の適応的手法を活用しており、Ultralytics HUBのようなプラットフォーム内で設定可能であることが多い。

関連概念との違い

勾配降下法とは、最適化アルゴリズムの一種で、バックプロパゲーションによって計算された勾配を用いてモデルのパラメータを調整することにより、損失関数を反復的に最小化することに焦点を当てたものである。関連する概念とは異なります:

実世界での応用

勾配降下法は、数え切れないほどの実世界のAIアプリケーションの学習モデルを支えるエンジンである:

  1. 医療画像解析: ヘルスケアにおけるAIでは、勾配降下法は医療画像解析のようなタスクのためのモデルを訓練する。例えば、MRIやCTスキャンの腫瘍を検出するために、畳み込みニューラルネットワーク(CNN)を勾配降下法を用いて学習させることができる(ブログ記事の例を参照)。このアルゴリズムは、モデルが予測した腫瘍領域と、放射線科医が提供したグランドトゥルース注釈との差を最小化する。
  2. 推薦システム: Netflixや Amazonのような企業は、勾配降下法で学習させたモデルを使ってユーザーの嗜好を予測し、映画や商品を推薦している。このアルゴリズムは、予測された評価/インタラクションと実際のユーザー行動との誤差を最小化するようにモデルのパラメータを調整し、よりパーソナライズされたレコメンデーションへと導く。
  3. 自律走行: 自律走行車の知覚モデルは、トレーニング時に勾配降下法に依存している。カメラやLiDARデータを使用した歩行者、車両、交通標識の検出のようなタスク(自動車のAIに関連)では、このアルゴリズムは、モデルが予測したバウンディングボックスやセグメンテーションマスクと、トレーニングデータ内の実際のオブジェクトの位置との間の不一致を最小化する。
すべて読む