用語集

正則化

L1、L2、ドロップアウト、早期停止などの正則化テクニックがオーバーフィッティングを防止し、ロバストなMLモデルを実現する方法をご紹介します。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

正則化は、機械学習(ML)やディープラーニング(DL)において、オーバーフィッティングを防ぐために使われる重要なテクニックである。これにより、新しい未知のデータに対する汎化がうまくいかなくなる可能性がある。正則化は、モデルの学習プロセスに追加の制約やペナルティを導入し、より単純なパターンを学習するように促します。正則化項を損失関数に追加することで、モデルが単一の特徴に過度に依存したり、特徴に過度に大きな重みを割り当てたりすることを抑制します。

正則化の種類

正則化手法にはいくつかの種類があり、それぞれがモデルの複雑さを制御するための独自のアプローチを持っている。最も一般的なものはL1正則化とL2正則化です。

  • L1 正則化 (Lasso Regression):この手法は、係数の大きさの絶対値に等しいペナルティを追加します。これは、いくつかの係数がちょうどゼロになるスパース・モデルを導き、特徴選択を効果的に実行します。特徴工学の詳細はこちら
  • L2 正則化(リッジ回帰).この手法は,係数の大きさの2乗に等しいペナルティを追加する.これは係数をゼロに向かって縮める傾向はあるが、正確にゼロにはしない.最適化アルゴリズムの詳細

その他の正則化テクニックには以下のようなものがある:

  • ドロップアウト:このテクニックは、各訓練反復中にニューロンの割合をランダムにドロップアウト(ゼロに設定)し、特定のニューロンの存在に依存しない、よりロバストな特徴をネットワークに学習させる。
  • 早期停止:これは、検証データセット上でのモデルのパフォーマンスを監視し、パフォーマンスが低下し始めたときに学習プロセスを停止することで、モデルがオーバーフィットし始めていることを示す。
  • データの拡張:画像データの場合、回転、反転、切り抜きなど、既存のデータにランダムな変換を加えることで、学習データセットのサイズを人工的に増やす手法。データ増強の詳細を見る。

正則化の重要性

正則化は、ロバストで汎化可能なMLモデルを構築する上で重要な役割を果たす。正則化なしでは、特に高次元データやディープニューラルネットワークのような複雑なモデルアーキテクチャを扱う場合、モデルはオーバーフィットしやすくなります。モデルの複雑さを制御することで、正則化は、新しい未知のデータに対して正確な予測を行うモデルの能力を向上させるのに役立ちます。これは、モデルが学習環境とは異なる環境で展開される可能性がある実世界のアプリケーションにとって極めて重要です。

正則化の応用

正則化は、以下のような幅広いMLアプリケーションで使用されている:

実際のAI/ML応用例

  1. 医療診断:ヘルスケアでは、異常検出や診断のために、X線やMRIのような医療画像の解析にAIモデルが使用される。ドロップアウトやL2正則化などの正則化技術がCNNに適用され、モデルが学習データに適合しすぎないようにし、新しい患者のスキャン画像に潜在する健康上の問題を正確に特定できるようにしています。さらに詳しく知りたい方は、AIが放射線医学をどのように変えるかをご覧ください。
  2. 自動運転車:自律走行車は、物体検出、車線検出、シーン理解のためにコンピュータビジョンモデルに大きく依存している。多様な走行条件や環境にうまく汎化できるロバストなモデルを訓練するために、データ増大や早期停止を含む正則化手法が採用されています。自動運転におけるビジョンAIの詳細については、こちらをご覧ください。

レギュラー化と関連用語

正則化は、バイアスと分散のトレードオフオーバーフィッティングアンダーフィッティングなど、MLにおける他の概念と密接に関連している。正則化はモデルの複雑さを制御することでオーバーフィッティングを防ぐのに役立ちますが、バイアスと分散のバランスを取ることが重要です。単純すぎるモデルはデータにアンダーフィットする可能性があり、複雑すぎるモデルはオーバーフィットする可能性があります。ハイパーパラメータのチューニングは、与えられたモデルとデータセットに最適な正則化のレベルを見つけるためによく使われます。

結論

正則化はMLの実務家にとって不可欠な手法である。様々な正則化手法を理解し適用することで、実務家は新しい未知のデータに対して優れた性能を発揮する、よりロバストで汎化可能なモデルを構築することができます。画像データ、テキストデータ、または他のタイプのデータのいずれを扱う場合でも、正則化はMLモデルのパフォーマンスと信頼性を向上させるのに役立ちます。コンピュータ・ビジョンとUltralytics YOLO のような最先端のモデルに関するより多くの洞察については、Ultralytics ブログをご覧ください。

すべて読む