用語集

パラメータ効率微調整(PEFT)

PEFT(Parameter-Efficient Fine-Tuning)を発見:最小限のリソースで大規模AIモデルを効率的に適応。NLP、ビジョンなどのタスクを最適化します!

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

PEFT(Parameter-Efficient Fine-Tuning)は、大規模な事前学習済みモデルを最小限の計算オーバーヘッドで新しいタスクに適応させるために設計された機械学習アプローチである。パラメータの小さなサブセットのみを微調整することで、PEFT技術は微調整プロセスをより効率的にし、必要なリソースを削減し、事前に訓練されたモデルにエンコードされた一般的な知識を保持する。

PEFTの重要性

従来のファインチューニングでは、モデルの全パラメータを更新する必要があり、特に変換器ベースのアーキテクチャのような大規模なモデルでは、計算コストが高く、メモリ消費量も多くなります。PEFTは、事前学習済みモデルの大部分を変更しないまま、一部のパラメータのみを変更することで、この問題に対処します。このアプローチは、計算リソースが限られている場合や、モデル全体を毎回再トレーニングすることなくカスタマイズが必要な複数のタスクを扱う場合に特に有益です。

PEFT技術は、AIにおけるリソース効率の高いソリューションに対する需要の高まりに合致しており、ヘルスケア、農業、小売業など、さまざまな業界にわたって大規模モデルの実用化を可能にします。

PEFTの主なテクニック

パラメータを効率的に微調整するためのアプローチがいくつか開発されている:

  • 低ランク適応(LoRA):LoRAはタスクに特化した低ランクの更新をモデルに注入し、新しいタスクに適応するためにこれらの追加パラメータのみを最適化する。
  • アダプターレイヤー:これはモデルのアーキテクチャに挿入される小さなニューラルネットワークモジュールで、通常はレイヤーの間に挿入され、タスク固有の調整を学習する。
  • プロンプトのチューニング:この方法では、モデルのパラメータは変更せずに、モデルに入力される入力プロンプトのみをチューニングします。プロンプトチューニングの詳細はこちら。
  • プレフィックスチューニング:プロンプトチューニングと同様に、プレフィックスチューニングは、入力データのプレフィックスとして機能するタスク固有のパラメータのシーケンスを最適化する。

各手法は、下流タスクで高いパフォーマンスを維持しながら、トレーニング時間とリソース使用量を削減することを目的としている。

PEFTの応用

PEFTは、特にリソースの制約やタスクの多様性が重要な考慮事項である場合、AIや機械学習の幅広い領域で応用されている。

例1:自然言語処理(NLP)

自然言語処理では、GPT-3や GPT-4のような大規模な言語モデルを、感情分析、要約、ドメイン固有の質問応答などの特定のタスクに適応させるために、PEFT技術が広く使われている。例えば、LoRAは医療テキスト分析用にGPT-3を微調整するために適用され、計算量を最小限に抑えながら正確な予測を可能にする。

例2:ビジョンAI

コンピュータ・ビジョンでは、PEFTは次のような事前に訓練されたモデルを微調整するために使用されます。 Ultralytics YOLOのような事前に訓練されたモデルを、特殊なデータセットに含まれる希少な物体を検出するような特定のタスク向けに微調整するために使用されます。モデルの重みのごく一部だけを微調整することで、組織は大規模な再トレーニングを行うことなく、野生動物のモニタリングや工業品質管理などのタスクに合わせたソリューションを迅速に展開することができる。

PEFTのメリット

  1. リソース効率:エッジデバイスや限られたリソースしかない環境でも利用できるように、計算とメモリーの要件を削減します。
  2. タスクの柔軟性:モデル全体を再トレーニングすることなく、複数のダウンストリームタスクに迅速に適応することができます。
  3. 費用対効果:小さなパラメータのサブセットに焦点を当てることで、大規模なモデルの微調整にかかるコストを削減。
  4. 一般知識の保持:事前に訓練されたモデルの汎用的な能力を保持しつつ、タスク固有の専門知識を追加する。

従来のファインチューニングとの違い

従来のファインチューニングでは、モデル全体を更新するため、計算コストがかかり、特にデータセットが小さい場合にはオーバーフィッティングになりやすい。一方、PEFTは最小限のパラメータを最適化することに重点を置き、計算オーバーヘッドを大幅に削減しながら同等の結果を達成する。

PEFTはまた、事前学習されたモデルを、一部または全部の層を再学習することによって新しいタスクに適応させる転移学習とも異なる。転移学習はモデルの完全な再学習を含むことができるが、PEFTはパラメータの更新を最小化するように明示的に設計されている。

実社会への影響

PEFTの採用により、リソースに制約のある環境でのAIソリューションの普及が可能になった。例えば、農業分野では、PEFTは、低消費電力デバイスで動作しながら、作物の病気を正確に検出するためにビジョンモデルを微調整することができます。同様にヘルスケアでは、Ultralytics ヘルスケアソリューションで強調されているように、PEFTは特殊なデータセットを使用して腫瘍検出のようなタスクにモデルを適応させることを容易にする。

PEFTはまた、Ultralytics HUBのようなツールに統合されており、カスタムモデルのトレーニングとデプロイメントを簡素化することで、ユーザーは事前にトレーニングされたモデルを独自のニーズに合わせて効率的に適応させることができる。

結論

PEFT(Parameter-Efficient Fine-Tuning)は、AIをより利用しやすく、適応しやすくするための重要な一歩です。大規模なモデルを新しいタスクに効率的に適応させることで、PEFTは、コストと計算需要を削減しながらAIの可能性を最大限に活用することを可能にします。PEFTは、NLP、コンピュータビジョン、そしてそれ以外の分野にも応用され、AI技術の進歩において極めて重要な役割を果たし続けています。

すべて読む