用語集

ノーマライゼーション

機械学習における正規化の威力をご覧ください!モデル学習を強化し、パフォーマンスを向上させ、ロバストなAIソリューションを実現する方法をご覧ください。

正規化は、機械学習(ML)や人工知能(AI)において重要なデータ前処理技術である。これは、データセットの数値特徴を、その範囲の違いを歪めることなく、共通のスケールに変換することを含む。このスケーリング処理は、多くのアルゴリズム、特にニューラルネットワーク(NN)の訓練に使用される勾配ベースの最適化手法など、入力値の大きさに敏感なアルゴリズムの性能と安定性にとって不可欠である。すべての特徴がモデルの学習プロセスに比例して寄与するようにすることで、正規化は学習を加速し、モデル全体の精度を向上させるのに役立ちます。

なぜノーマライゼーションが重要なのか?

正規化しないと、スケールの大きな特徴がモデルの学習プロセスを支配する可能性がある。例えば、住宅価格を予測するデータセットでは、"square footage"(例えば1000-3000)のような特徴は、"number of bedrooms"(例えば2-5)よりもはるかに大きな範囲を持つことになる。この食い違いは、勾配降下のようなアルゴリズムが収束するのに時間がかかったり、局所最適にはまり込んだりする原因となる。正規化は、すべての特徴を同じ土俵に乗せることで、これを緩和します:

ノーマライゼーションvs.スタンダード化vs.バッチ・ノーマライゼーション

正規化と標準化はしばしば同じ意味で使われますが、異なる技術です。また、データ正規化とバッチ正規化を区別することも重要です。

  • 正規化(最小-最大スケーリング):この技法は、通常、データを一定の範囲にスケーリングする。データの分布がガウス分布でない場合や、アルゴリズムが特定の分布を想定していない場合に有効です。データ前処理の一般的なステップです。
  • 標準化(Zスコア正規化):最小-最大スケーリングとは異なり、境界範囲を持たない。標準化は、データがガウス分布に従う場合に好まれることが多く、外れ値の影響を受けにくい。
  • バッチ正規化:これはデータの前処理ステップではなく、ディープラーニングモデル内で使用されるレイヤーである。学習中のミニバッチごとにレイヤーへの入力を正規化する。これにより、内部の共変量シフトに対抗し、ディープ・ネットワークの学習を安定させ、加速させることができる。これは、UltralyticsのYOLOモデルを含む多くの最新アーキテクチャの標準コンポーネントであり、PyTorchや TensorFlowなどのフレームワークで実装されている。

正規化の応用

正規化は様々なドメイン、特にコンピュータビジョン(CV)において標準的なプラクティスである。Ultralytics HUBのようなプラットフォームは、このような前処理が高性能モデルのトレーニングに不可欠なワークフローを合理化します。

  • 画像データの前処理:コンピュータ・ビジョンでは、画像はピクセル値で構成され、その範囲は通常0~255である。画像分類や 物体検出のようなタスクのモデルに画像を入力する前に、これらのピクセル値はほとんどの場合正規化されます。ピクセル値を[-1, 1]の範囲にスケーリングすることで、データセット内のすべての画像で一貫性が保たれ、これはYOLO11のようなモデルが効率的に特徴を学習するために重要です。
  • 医療画像解析: ヘルスケアにおけるAIのような分野では、MRIやCTのような医療スキャンは、しばしば異なる設定で異なる機械から提供され、異なる強度スケールをもたらす。腫瘍検出にAIを使用する場合、これらのスキャンを正規化することは重要なステップです。これにより、モデルの分析が異なる患者や機器間で比較できるようになり、より信頼性の高い正確な診断予測につながります。これは医療画像解析における基本的な概念である。
  • ファイナンスにおける予測モデリング株価を予測したり信用リスクを評価したりするモデルを構築する場合、データセットには取引量(単位:百万)や株価収益率(例:10~50)など、スケールが大きく異なる特徴が含まれることが多い。これらの特徴を正規化することは、距離ベースのアルゴリズムにとって不可欠であり、勾配ベースの学習が金融分野のコンピュータビジョンでよく行われる、より大きなスケールの特徴によって歪まないことを保証する。

Ultralyticsコミュニティに参加する

AIの未来に参加しませんか。世界のイノベーターとつながり、協力し、成長する

今すぐ参加する
クリップボードにコピーされたリンク