用語集

ノーマライゼーション

機械学習における正規化の威力をご覧ください!モデル学習を強化し、パフォーマンスを向上させ、ロバストなAIソリューションを実現する方法をご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

正規化とは、機械学習やデータサイエンスにおける重要な前処理技術であり、データを標準的な範囲(通常は0~1、または-1~1)に再スケールするために使用される。このプロセスは、すべての特徴がモデル学習に等しく寄与することを保証し、大きな値を持つ特徴が小さな値を持つ特徴を支配することを防ぐことを目的としている。異なる特徴を同じようなスケールにすることで、正規化はアルゴリズム、特にディープラーニングで使用される勾配降下ベースの手法のような特徴のスケーリングに敏感なアルゴリズムが、より速く効率的に収束するのに役立ちます。

ノーマライゼーションが重要な理由

データセットでは、特徴量はしばしば様々な範囲を持っている。例えば、住宅価格を予測するデータセットでは、家の大きさは500から5000平方フィートの範囲かもしれないが、ベッドルームの数は1から5までしかないかもしれない。正規化なしでは、機械学習モデルは範囲の大きい特徴を過度に重要視してしまうかもしれない。正規化はこの問題に対処し、学習中にすべての特徴が一様に扱われるようにします。これは、特にUltralytics YOLO モデルで使用されるニューラルネットワークのようなアルゴリズムにおいて、より安定した頑健なモデル、パフォーマンスの向上、学習時間の短縮につながります。

ノーマライゼーションの種類

いくつかの正規化技術が一般的に使用されている:

  • 最小-最大スケーリング:最も一般的な手法のひとつ。これは、各特徴が[0, 1]の範囲になるように個別にスケーリングし、変換します。Min-Maxスケーリングの詳細については、Scikit-learnのウェブサイト(Python の有名な機械学習ライブラリ)を参照してください。
  • Zスコアの標準化:厳密には標準化だが、正規化と同じ意味で使われることが多い。Zスコアの標準化は、平均が0、標準偏差が1になるようにデータを変換します。この方法は、Min-Maxスケーリングに比べて外れ値の影響を受けにくくなります。
  • 最大 Abs スケーリング:この方法は、各特徴をその最大絶対値でスケーリングします。特に疎なデータに有効で、値が [-1, 1] の範囲内に収まるようにします。

適切な正規化手法の選択は、データセットと使用される機械学習モデルに依存する。物体検出のためのUltralytics YOLO モデルのトレーニングを含む多くの深層学習アプリケーションでは、正規化は標準的な前処理ステップである。

正規化の応用

正規化は、AIやMLの様々な領域で広く適用されている。いくつか例を挙げよう:

  • 画像処理:コンピュータビジョンでは、画像は0から255までのピクセル値で表現されることが多い。これらのピクセル値を0から1の範囲に正規化することは、畳み込みニューラルネットワーク(CNN)に入力する前によく行われる。これにより、画像から特徴を学習するモデルの能力が向上し、Ultralytics YOLOv8 、画像分類を使用した物体検出のようなタスクが改善されます。コンピュータビジョンプロジェクトにおいて、注釈付きデータの前処理が、最適なモデル性能を実現するためにいかに重要であるかを考えてみましょう。
  • 医用画像解析 医療画像解析では、異なるスキャナーや患者からの画像の強度範囲を標準化するために正規化が重要です。この標準化は、医療画像のソースに関係なく、AIモデルが異常や疾患を正確に検出するために極めて重要です。例えば、Ultralytics YOLO11 を用いた 医療画像における脳腫瘍の検出では、一貫した正規化により、多様なデータセットにわたってモデルのロバスト性と信頼性が保証される。

要約すると、正規化は機械学習用にデータを準備する際の基本的なステップである。すべての特徴から公平な寄与を保証し、学習を加速し、Ultralytics YOLO を搭載したものを含む様々なアプリケーションにおけるAIモデルの安定性とパフォーマンスを向上させる。

すべて読む