プロンプト・エンリッチメントでAIを使いこなす!文脈、明確な指示、正確な結果を得るための例を使用して、大規模言語モデルの出力を強化します。
プロンプトエンリッチメントとは、人工知能(AI)モデル、特に大規模言語モデル(LLM)に入力する前に、ユーザーの初期入力プロンプトを自動的または半自動的に強化するプロセスである。その目的は、関連する文脈を追加したり、あいまいさを明確にしたり、制約を課したり、AIがより正確で適切かつ有用な応答を生成するのに役立つ特定の詳細を含めたりすることである。この技術は、ユーザがプロンプト工学の専門家であることを必要とすることなく、プロンプトをより効果的にすることで、ユーザとAIシステム間のインタラクションの質を向上させる。
このプロセスでは通常、元のプロンプトを分析し、追加の情報ソースまたは事前に定義されたルールを活用してプロンプトを補強する。これには、ユーザー履歴へのアクセス、ナレッジベースからの関連ドキュメントの取得、会話コンテキストの組み込み、特定のフォーマット指示の適用などが含まれる。例えば、「Ultralytics YOLOください」のような漠然としたプロンプトは、ユーザーが最新バージョン(YOLOv11)に興味がある、または YOLOv8.システムが関連するデータのスニペットを取得し、プロンプトのコンテキストウィンドウに追加するRAG(Retrieval-Augmented Generation)のような技術がしばしば採用される。
プロンプト・エンリッチメントは、さまざまなAI主導のタスクに応用できる:
プロンプト・エンリッチメントを類似の用語と区別することは重要である:
標準的な物体検出のような伝統的なコンピュータビジョンタスクではあまり一般的ではありませんが、このコンセプトはYOLOEのような新しいプロンプトビジョンモデルに関連しています。Ultralytics HUBのようなプラットフォームは、複雑なビジョンタスクを定義する際に、ユーザーとのインタラクションを簡素化するために、このような技術を組み込む可能性があります。