用語集

プロンプトエンジニアリング

コンテンツやカスタマーサービスなどにおいて、LLMのようなAIモデルを正確で高品質なアウトプットに導くためのプロンプトエンジニアリングの技術を習得する。

プロンプト・エンジニアリングとは、人工知能(AI)モデル、特に大規模言語モデル(LLM)が望ましい出力を生成するよう導くための効果的な入力(プロンプト)を設計する技術と科学である。これは、AIと熟練したコミュニケーターになることに似ており、可能な限り最良の反応を得るために何をどのように言うべきかを正確に知っている。AIモデルのアウトプットのパフォーマンス、関連性、品質は、クエリのフレーミング方法に非常に敏感であるため、この実践は極めて重要である。効果的なプロンプト・エンジニアリングにより、ユーザーは強力な基礎モデルの潜在能力を幅広いタスクに活用することができます。

プロンプト・エンジニアリングの仕組み

プロンプトエンジニアリングの核心は、モデルに明確で十分な文脈を提供する入力の構造化である。単純な質問であれば基本的な回答が得られるが、うまく設計されたプロンプトであれば、トーン、形式、複雑さをコントロールすることができる。高度なプロンプトの主な構成要素には以下のようなものがある:

  • 指示:モデルにどのようなタスクを実行させるかを指示する、明確で具体的な指示(例:「次の記事を3つの箇条書きで要約しなさい」)。
  • コンテキスト:関連する背景情報やデータを提供すること。
  • ペルソナ:AIが採用する役割を割り当てることで、アウトプットのトーンやスタイルに影響を与える(例:「金融アナリストの専門家として行動する」)。
  • フォーマット:リスト、JSONオブジェクト、特定の書き方など、出力の希望する構造を指定する。
  • :希望する入力と出力形式の例を含めることは、数ショット学習として知られるテクニックで、モデルの応答を導くのに役立ちます。これらのテクニックの包括的なリソースは、プロンプティングガイドにあります。

実世界での応用

  1. カスタマーサポートの自動化:ブランドの一貫性と正確性を確保するために、企業はサポートチャットボットを導くためにプロンプトエンジニアリングを使用することができます。プロンプトは、フレンドリーで親切な口調を採用し、製品の質問に答えるために社内のナレッジベースを使用し、人間のエージェントに会話をエスカレーションする際の明確なプロトコルを定義するようにAIに指示するかもしれません。これにより、AIの行動を制御し、間違った情報を伝えたり、ブランド外の方法で顧客と対話したりすることを防ぎます。

  2. クリエイティブなコンテンツ生成Midjourney』や OpenAIの『DALL-E 3』のようなテキストから画像への変換モデルでは、プロンプトが創造のための主要なツールとなる。車の写真 "のような単純なプロンプトは、一般的な結果を生成します。しかし、「夕暮れの海岸沿いのハイウェイを疾走する1960年代のヴィンテージの赤いスポーツカー、フォトリアリスティックなスタイル、映画のような照明、8Kの解像度」のような詳細なプロンプトは、被写体、設定、スタイル、品質に関する具体的な指示を提供し、高度に調整された視覚的に魅力的な画像を生成します。

コンピュータ・ビジョンにおける関連性

プロンプトエンジニアリングは自然言語処理(NLP)に端を発するが、コンピュータビジョン(CV)でもその重要性が増している。この背景には、テキストと画像を同時に処理できるマルチモーダルモデルの開発がある。CLIPのようなモデルやYOLO-Worldのようなオープンボキャブラリ検出器は、任意のテキスト記述に基づいて物体検出のようなタスクを実行することができる。これらのモデルにとって、効果的なテキストプロンプト(例えば、「すべての "自転車 "を検出するが、"オートバイ "は無視する」)を作成することは、これらのビジョン言語モデルを導くために重要なプロンプトエンジニアリングの一形態である。Ultralytics HUBのようなプラットフォームは、様々なモデルとのインタラクションを容易にし、インタフェースを介してタスクを定義することで、プロンプトエンジニアリングの原則の恩恵を受けることができる。

プロンプト・エンジニアリングと関連コンセプト

プロンプト・エンジニアリングを他の機械学習の概念と区別することは重要である:

  • 微調整:これは、新しいデータセットで学習プロセスを継続することで、モデルの重みを更新することである。一方、プロンプトエンジニアリングは、モデルそのものを変更するのではなく、推論時に既存のモデルの振る舞いをガイドする。
  • プロンプト・チューニング:パラメータ効率の良い微調整(PEFT)手法の一つであるプロンプトチューニングでは、入力の前に付加される「ソフトプロンプト」のエンベッディングの小さなセットを学習する。プロンプトエンジニアリングがテキストベースの "ハードプロンプト "を手作業で作成するプロセスであるのに対して、学習によってプロンプトの作成を自動化する。
  • チェーン・オブ・ソート(CoT)プロンプティング:CoTはプロンプトエンジニアリング特有の手法で、プロンプトに「ステップ・バイ・ステップで考える」といった指示を追加する。これは、複雑な問題を中間的な推論ステップに分解することをモデルに促し、より正確な結果を導くことが多い。
  • プロンプト・チェイニング:このテクニックでは、複雑なタスクを複数の連続したプロンプトに分割し、1つのステップの出力を次のステップの入力とします。プロンプトエンジニアリングは、個々のプロンプトを効果的に設計するための幅広い実践です。LangChainのようなフレームワークは、このような連鎖をオーケストレーションするように設計されている。
  • 検索補強型ジェネレーション(RAG):RAGは、まず外部の知識ベースから関連データを検索することにより、プロンプトを強化するシステムである。RAGシステムでは、最初の検索クエリと、ユーザーの質問と検索された情報を組み合わせた最終的なプロンプトの両方を正しく作成するために、プロンプトエンジニアリングが重要である。

Ultralyticsコミュニティに参加する

AIの未来に参加しませんか。世界のイノベーターとつながり、協力し、成長する

今すぐ参加する
クリップボードにコピーされたリンク