プロンプトチューニングは、タスク固有のプロンプトに関連する小さなパラメータのセットのみを微調整することで、特定のタスクに事前に訓練されたモデルを適応させ、最適化するために使用される手法である。このアプローチは、モデル全体を再トレーニングする従来の微調整手法と比較して、計算コストとストレージ要件を削減する。プロンプトチューニングは、自然言語処理(NLP)やコンピュータビジョン(CV)のようなドメインで特に効果的であり、ユーザは、多様なアプリケーションのために事前に訓練された大規模なモデルのパワーを活用することができます。
プロンプトチューニングは、モデルのコアアーキテクチャや重みを変更するのではなく、事前に訓練されたモデルに供給される入力プロンプトやエンベッディングを変更する。タスク固有の情報やパラメータを入力データに追加することで、モデルは新しいタスクに予測を適応させるように導くことができます。この方法は、GPT-4や Vision Transformers (ViT)のような大規模なモデルを扱う場合に特に有効で、ネットワーク全体の再トレーニングには計算コストがかかります。
プロンプトチューニングと類似しているが、アダプターや低ランク適応のような広範な戦略を含む。
プロンプト・チューニングは、ドメイン固有の課題を解決するために、さまざまな業界で成功裏に適用されている。以下は2つの顕著な例である:
GPTのような大規模言語モデルをタスク固有のプロンプトで微調整することで、企業はレビューやソーシャルメディア投稿から顧客の感情を分析することができます。例えば、フィードバックを肯定的、中立的、否定的に分類するようモデルを促し、顧客サービスのワークフローを改善することができます。
医用画像処理において、プロンプトのチューニングは、Segment Anything Model (SAM) のような事前に訓練されたモデルを、腫瘍検出や臓器セグメンテーションのような特定のタスクに適応させるのに役立つ。タスク固有のプロンプトをカスタマイズするだけで、医療従事者はモデル全体を再トレーニングすることなく、正確な結果を得ることができる。
プロンプト・チューニングは、ファイン・チューニングや ゼロ・ショット・ラーニングのような他の方法と類似しているが、ユニークな利点もある:
いくつかのフレームワークは、NLPやCVタスクのためのプロンプトチューニングをサポートしており、研究者や開発者にとって利用しやすくなっている:
プロンプトチューニングは、モデルの大規模化、複雑化に伴い、その重要性を増している。マルチモーダル学習と基礎モデルの台頭により、プロンプト・チューニングはタスクに特化した適応のためのスケーラブルなソリューションを提供する。プロンプト・チューニングはまた、AIをより身近で効率的なものにする方向への業界のシフト、特にヘルスケアや 製造業などの分野における実世界での応用に合致している。
関連する概念やアプリケーションの詳細については、AI & Computer Vision Glossaryをご覧ください。