モデルの重みは、学習された機械学習モデルの中核であり、モデルがどのように予測を行うかを決定する学習済みパラメータを表す。これらの数値は、モデルの予測値と学習データから得られる実際のグランドトゥルースとの差を最小化するために、学習プロセス中に調整される。要するに、モデルの重みとは、モデルが「学習」し、画像認識、自然言語処理、物体検出などのタスクを実行するために使用するものである。
ニューラルネットワークは、調整可能なつまみがたくさんある複雑な関数だと考えてほしい。モデルの重みはこれらのノブであり、学習プロセスとはこれらを微調整することである。最初は、これらの重みはランダムな値に設定される。モデルが訓練データにさらされるにつれて、これらの重みを反復的に調整し、パフォーマンスを向上させる。この調整は、予測誤差を定量化する損失関数を最小化することを目的とするアダム・オプティマイザーや 確率的勾配降下法(SGD)のような最適化アルゴリズムによって導かれる。
各重みの大きさと符号は、ニューラルネットワークのニューロン間の接続の強さと方向を決定する。重みが大きいほど影響が強く、小さいほど影響が小さいことを示す。何度も繰り返される反復(エポック)を通して、モデルはこれらの重みを洗練させ、データの根底にあるパターンを捉え、新しい未知のデータに対して正確な予測を可能にする。
モデルの重みは、機械学習モデルの学習された知識をカプセル化するため、非常に重要である。最適化された重みを持つよく訓練されたモデルは、新しいデータに対して効果的に汎化することができる。逆に、訓練が不十分な重みは、訓練データが不十分であったり、偏っていたり、訓練手法が不適切であったりすることが原因であることが多く、予測が不正確であったり、信頼できなかったりする。
モデルの重みの質は、精度、速度、汎化能力など、モデルの性能の重要な側面に直接影響する。Ultralytics YOLO の文脈では、COCOのような大規模データセットで学習された重みである、事前学習済みの重みが提供されることが多い。これらの事前訓練された重みは、推論に直接使用することも、カスタムデータセットで微調整を行うための出発点として使用することもでき、訓練時間を大幅に短縮し、特定のタスクのパフォーマンスを向上させることができます。利用可能な様々な事前学習済みUltralytics YOLO モデルを調べることができます。
モデルウェイトは、多くの実世界のアプリケーションにおいて、AIの機能性の基礎となっている。以下にいくつかの例を挙げる:
Ultralytics YOLO は、事前に訓練されたモデルの重みと、カスタムモデルを訓練して独自の重みを生成するためのツールの両方をユーザーに提供します。ユーザーは、Ultralytics HUBから、またはUltralytics ドキュメントから直接、訓練済みの重みをダウンロードすることができる。これらの重みは、事前に訓練されたUltralytics YOLOv8 モデルですぐにオブジェクト検出のようなタスクに使用したり、Ultralytics 訓練ツールを使用してカスタムデータセットで微調整することができます。
さらに、Ultralytics HUBは、モデルのトレーニング、管理、展開のプロセスを簡素化するため、ユーザーは重みの最適化と管理の複雑さを掘り下げる必要なく、特定のアプリケーションに集中することができます。モデルの重みを最適化したモデル展開の実践は、実世界のシナリオで効率的かつ効果的なAIソリューションを確保するために極めて重要です。