用語集

最適化アルゴリズム

最適化アルゴリズムが、ニューラルネットワークのトレーニングからヘルスケアや農業における実際のアプリケーションまで、AIやMLのパフォーマンスをどのように向上させるかをご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

人工知能(AI)や機械学習(ML)の領域では、最適化アルゴリズムはモデルを改良し、そのパフォーマンスを向上させるために使用される重要な手法である。これらのアルゴリズムは、モデルの予測値と実際の目標値との差を測定する、あらかじめ定義された損失関数を最小化するために、モデルのパラメータ(weights and biases)を繰り返し調整する。このプロセスは、ニューラルネットワークのような複雑なモデルを学習するための基本であり、データから効果的に学習し、画像認識から自然言語処理に至るまで、さまざまなタスクの精度と信頼性を向上させることができる。

AIと機械学習における関連性

最適化アルゴリズムは、ほとんどのMLモデル、特にディープラーニング(DL)における学習プロセスを推進するエンジンである。畳み込みニューラルネットワーク(CNN)やリカレント・ニューラル・ネットワーク(RNN)などのモデルは、広大なパラメータ空間をナビゲートし、良好なパフォーマンスをもたらす構成を見つけるために、これらのアルゴリズムに大きく依存している。効果的な最適化がなければ、モデルは最適解に収束するのに苦労し、その結果、予測精度が低下する。例えば Ultralytics YOLOモデルは、リアルタイムの物体検出で高い精度を達成するために、トレーニング中に高度な最適化アルゴリズムを利用しています。これらのアルゴリズムは、GPT-4やその他の大規模言語モデル(LLM)のような最先端モデルの学習にも不可欠であり、その素晴らしい能力を可能にしています。オプティマイザの選択は、モデル学習のヒントに関するガイドで説明したように、学習速度と最終的なモデル性能に大きな影響を与えます。

キーコンセプトとアルゴリズム

機械学習では、いくつかの最適化アルゴリズムが広く使われており、それぞれが損失ランドスケープをナビゲートするための異なる戦略を提供している。一般的な例をいくつか挙げる:

  • 勾配降下:損失関数の勾配と逆方向にパラメータを繰り返し移動させる基礎的なアルゴリズム。
  • 確率的勾配降下法 (SGD):勾配降下のバリエーションで、各ステップにおいて少量のバッチまたは単一のサンプルのみを使用してパラメータを更新するため、より高速で大規模なデータセットに適しています。
  • アダム・オプティマイザー:適応的学習率法は、異なるパラメータに対する個別の学習率を計算し、多くの場合、より速い収束をもたらす。RMSpropとAdaGradのアイデアを組み合わせたもの。
  • RMSprop:指数関数的に減衰する勾配の2乗平均で学習率を割る、もう1つの適応的学習率アルゴリズム。

これらのオプティマイザは、多くの場合、Ultralytics HUBのようなMLフレームワークやプラットフォーム内で設定可能なパラメータであり、ユーザーは特定のタスクやデータセットに最適なものを選択することができる。

関連概念との違い

最適化アルゴリズムは、ハイパーパラメータ・チューニングや正則化といった関連概念と混同されることがあるが、これらは異なる目的を果たすものである:

  • 最適化アルゴリズムとハイパーパラメータの調整:最適化アルゴリズムは、学習中に損失関数を最小化するためにモデルのパラメータweights and biases)を調整する。一方、ハイパーパラメータチューニングは、学習プロセスそのものを定義する最適なハイパーパラメータ(学習率、バッチサイズ、ネットワークアーキテクチャの選択など)を見つけることに重点を置く。Ray Tuneのようなツールは、系統的なハイパーパラメータ探索のために統合することができる
  • 最適化アルゴリズムと正則化の比較:最適化は損失関数の最小値を見つけることを目的とする。正則化技術(L1/L2ペナルティやドロップアウト層など)は、ロス関数やモデル・アーキテクチャに追加され、オーバーフィッティングを防ぎ、未知のデータに対するモデルの汎化能力を向上させます。正則化は、最適化アルゴリズムが最小化しようとする目的を変更します。

実世界での応用

最適化アルゴリズムは、効率化を推進し、複雑なAIアプリケーションを可能にする、多くの産業で不可欠なものである。

例1:ヘルスケア診断

ヘルスケアのためのAIでは、最適化アルゴリズムは、医療画像分析で使用されるモデルのトレーニングに不可欠である。例えば、脳腫瘍データセットのようなデータセットを使用して、MRIやCTスキャンで癌腫瘍を検出するためにCNNをトレーニングする場合、アダムのような最適化アルゴリズムは、分類エラーを最小化することによって、モデルが悪性組織と良性組織を正確に区別することを学習するのに役立ちます。これは、放射線科医をサポートする、より信頼性の高い診断ツールにつながり、放射線学におけるAIアプリケーションで検討されているように、早期発見によって患者の転帰を改善する可能性がある。

例 2:物流とルートの最適化

輸送やロジスティクスに携わる企業は、最適化アルゴリズムを多用する。車両経路の問題では、配送車両の最短経路や最も費用対効果の高い経路を見つけることをアルゴリズムが目的としている。従来は、Google OR-Toolsに見られるようなオペレーションズ・リサーチの手法で解決してきたが、最適化アルゴリズムで訓練された機械学習モデルは、交通パターンや配送時間を予測してルートを動的に調整し、燃料消費と配送時間を最小限に抑えることもできる。これにより、サプライチェーン管理の効率が向上する。

すべて読む