Yolo 深圳
深セン
今すぐ参加
用語集

モデルの重み

モデルの重みがAIの知識として機能する仕組みを学びましょう。Ultralytics 最適化された重みを活用し、より高速で正確なトレーニングと推論を実現する仕組みを探求します。

モデル重みは、機械学習モデル内で学習可能なパラメータであり、入力データを予測出力に変換する役割を担う。ニューラルネットワークでは、これらの重みは異なる層にわたるニューロン間の接続の強さを表す。モデルが初期化されるとき、これらの重みは通常、ランダムな小さな値に設定される。つまり、モデルは何も「知らない」状態である。 学習と呼ばれるプロセスを通じて、モデルは誤りに基づいてこれらの重みを反復的に調整し、 データ内のパターン、特徴、関係を徐々に認識することを学びます。モデル重みはAIの「記憶」や「知識」と捉えることができ、 システムが学習データから学んだことを保存しています。

学習における重みの役割

ニューラルネットワークを学習させる主な目的は、モデルの予測値と実際の真値との誤差を最小化する最適な重み値のセットを見つけることである。 このプロセスでは、データをネットワークに通す(フォワードパスと呼ばれるステップ)後、特定の損失関数を用いて損失値を計算します。予測が正しくない場合、確率的勾配降下法(SGD) やYOLO26で使用される新しいミューオン最適化アルゴリズムなどの最適化アルゴリズムが、各重みが誤差にどれだけ寄与したかを計算します。

バックプロパゲーションと呼ばれる手法により、 アルゴリズムは重みをわずかに更新し、次回の誤差を低減します。このサイクルは数千回から数百万回繰り返され、 モデルの重みが安定しシステムが高精度を達成するまで続きます。学習が完了すると、 重みは「固定」され保存され、モデルは新規の未見データに対する推論に展開可能となります。

モデル重み vs. バイアス

weights and biases、連携して機能するものの異なる目的を果たすため、区別することが重要です。 モデルの重みはニューロン間の接続の強さと方向(活性化関数の傾きを制御)を決定する一方、 バイアスは活性化関数を左右にシフトさせる役割を担います。 このオフセットにより、全ての入力特徴量がゼロであっても、モデルがデータをより良く適合できるよう保証される。重みとバイアスが一体となって、畳み込みニューラルネットワーク(CNN)などのアーキテクチャの挙動を定義する学習可能なパラメータを形成する。

実際のアプリケーション

モデル重みは、AIシステムが様々な産業で機能することを可能にする中核的な構成要素です。以下に、その応用例を具体的に2つ示します:

  • 小売業におけるコンピュータービジョン: スマートスーパーマーケットシステムでは、YOLO26のようなモデルが学習済み重みを用いて棚上の商品を識別する。重みはシリアルボックスの形状やソーダ缶の色といった視覚的特徴を「学習」しており、これによりシステムはdetect 、在庫管理、さらには自動レジプロセスの効率的な実現を可能にする。
  • 医療画像解析:医療分野では、深層学習モデルが特殊な重み付けを用いて X線やMRIスキャンを分析する。例えば、腫瘍検出用に訓練されたモデルは その重み付けを活用し、正常組織と潜在的な異常を区別する。これらの重み付けは、 人間の目には捉えにくい複雑な非線形パターンをピクセルデータから抽出し、 放射線科医がより迅速な診断を下すのを支援する。

ウェイトの保存と読み込み

実際には、モデルの重み(学習済みパラメータ)を扱う際には、学習済みパラメータをファイルに保存し、後で予測や ファインチューニングUltralyticsのエコシステムでは、これらは通常、 .pt (PyTorch)ファイル

以下は、YOLO 、予測を実行する簡単な例です:

from ultralytics import YOLO

# Load a model with pre-trained weights (e.g., YOLO26n)
model = YOLO("yolo26n.pt")

# Run inference on an image using the loaded weights
results = model("https://ultralytics.com/images/bus.jpg")

# Print the number of detected objects
print(f"Detected {len(results[0].boxes)} objects.")

転移学習と微調整

モデル重みの最も強力な側面の一つは、その移植性である。開発者は、膨大なデータセットと多大な計算能力を必要とするゼロからのモデル訓練の代わりに、転移学習を頻繁に利用する。これは、大規模なデータセット(例: COCOImageNet などの大規模データセットで事前学習された重みを持つモデルを、特定のタスクに適応させることです。

例えば、汎用物体検出器の重みを取り出し、太陽光パネルのより小規模なデータセットで微調整することが可能です。 事前学習済みの重みは既にエッジ、形状、テクスチャを理解しているため、モデルの収束が大幅に高速化し、 ラベル付きデータの必要量が減少します。Ultralytics ツールはこのプロセスを簡素化し、 チームがデータセットを管理し、クラウド上でモデルを訓練し、最適化された重みをエッジデバイスにシームレスに展開することを可能にします。

圧縮と最適化

現代のAI研究では、性能を損なわずにモデル重みのファイルサイズを削減することに焦点が当てられることが多く、このプロセスはモデル量子化として知られている。重みの精度を低下させることで(例:32ビット浮動小数点から8ビット整数へ)、開発者はメモリ使用量を大幅に削減し、推論速度を向上させることができる。 これは、スマートフォンやラズベリーパイなどのリソース制約のあるハードウェアへのモデル展開において極めて重要である。さらに、プルーニングなどの技術により出力への寄与度が低い重みを削除することで、リアルタイムアプリケーション向けにモデルをさらに効率化できる。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加