用語集

モデル重量

機械学習におけるモデルの重みの重要性、予測におけるその役割、そしてUltralytics YOLO がどのようにAIタスクへの使用を簡素化するかをご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

モデル重みとは、機械学習モデルが学習過程で学習する核となるパラメータである。これらの数値は、学習データから得られた知識を表し、新しい未知のデータに対してモデルがどのように予測や決定を行うかの基本である。基本的に重みは、ニューラルネットワーク(NN)のニューロン間のように、モデル内の接続の強さと重要性を決定する。

モデルの重みを理解する

調整可能なつまみがたくさんある複雑な機械を想像してほしい。モデルの重みは、このつまみのような役割を果たす。学習中、モデルはデータセットから例を示され、予測を行う。これらの予測と実際の正解(ground truth)との差は、損失関数によって測定される。次に、確率的勾配降下(SGD)やアダムなどの 最適化アルゴリズムが、この損失を最小化するために、これらの重みを系統的に調整する。このプロセスは、何度も反復(エポック)して繰り返され、徐々に重みが調整されていく。当初、重みは小さなランダムな値に設定されることが多いが、訓練を通じて、データの根本的なパターンをとらえる値に収束していく。重みを、学習率や バッチサイズのようなハイパーパラメータと区別することは重要である。ハイパーパラメータは、学習中に学習されるのではなく、学習前に設定され、学習プロセスそのものを導く。バイアスは、NNの重みと並んでよく見られる、もうひとつのタイプの学習パラメータで、ニューロンのベースライン活性化を表す。

モデルの重みの意義

モデルの重みは、学習データから学習されたパターンと関係を符号化するため、非常に重要である。最適化された重みによって、モデルは効果的に汎化することができ、これまでに遭遇したことのないデータに対しても正確な予測を行うことができます。重みの質は、精度や頑健性といったモデルのパフォーマンス測定基準に直接影響します。ウェイトの訓練が不十分な場合、多くの場合、データ不足やオーバーフィッティングなどの問題が原因で、信頼性の低い予測になります。

現代の多くのAIアプリケーション、特にコンピュータビジョン(CV)では、モデルはImageNetや COCOのような大規模で一般的なデータセットで事前に訓練されることが多い。その結果得られる重みは、広範な視覚的特徴を捉えます。Ultralytics YOLO モデルで利用可能なものなど、これらの事前訓練された重みは、推論に直接使用したり、特定のタスクやカスタムデータセットで微調整するための出発点として使用することができます。転移学習として知られるこの手法は、学習を大幅にスピードアップし、特に限られたカスタムデータで、より優れたパフォーマンスにつながることがよくあります。Ultralytics HUBのようなプラットフォームを使用して、特定の重みでモデルを管理し、訓練することができます。

実世界での応用

モデルウェイトは、数え切れないほどのAIアプリケーションを支えるエンジンだ:

  1. 自律走行車における物体検出のようなモデル Ultralytics YOLOv8のようなモデルは、学習された重みを使用して、リアルタイムのビデオフィードで車、歩行者、交通標識などのオブジェクトを識別し、位置を特定し、より安全なナビゲーションを可能にする。重みは、モデルがピクセルパターンをどのように解釈してこれらの特定の物体を認識するかを決定します。
  2. 疾患検出のための医療画像解析ヘルスケアでは、医療画像(X線やMRIなど)で訓練されたAIモデルは、その重みを使用して、脳腫瘍データセットのようなデータセットを使用して脳スキャンで腫瘍の可能性を識別するなど、病気を示す微妙な異常を検出する。重みは、何千もの注釈付き医療画像から学習された視覚的特徴を符号化する。以下のようなツールがある。 Weights & Biasesのようなツールは、これらの重みを生成する実験を追跡するのに役立つ。
すべて読む