Yolo 深圳
深セン
今すぐ参加
用語集

プロンプトチェイニング

プロンプトチェイニングが複雑なAIタスクを信頼性の高いワークフローに分解する方法を学びましょう。Ultralytics LLMと統合し、高度なAIエージェントを構築する方法を探求しましょう。

プロンプトチェイニングは、人工知能(AI)開発における高度なアーキテクチャパターンであり、複雑なタスクを一連のより小さく管理可能なサブタスクに分解する手法です。このワークフローでは、あるステップの出力(多くの場合、大規模言語モデル(LLM)やコンピュータビジョンシステムによって生成される)が、次のステップの入力として機能します。 多面的な問題を一度に解決しようとする単一の巨大なプロンプトとは異なり、 チェーニングにより開発者はより信頼性が高く、テスト可能で、能力のあるアプリケーションを構築できます。 このモジュール式アプローチは、推論やウェブ閲覧、物理環境との相互作用が可能な高度なAIエージェントを作成するために不可欠です。

チェイニングの仕組み

プロンプトチェイニングの本質は、基礎モデルのコンテキストウィンドウと推論能力の限界に対処することにある。 プロンプトチェーニングはファウンデーションモデルにおけるコンテキストウィンドウと推論能力の限界に対処する。単一のリクエストでモデルに過度に異なる操作を要求した場合(例:「この画像を分析し、テキストを抽出し、スペイン語に翻訳し、JSON形式の請求書としてフォーマットせよ」)、エラー発生確率が増加する。これをパイプラインに分割することで、開発者は各段階の精度を検証できる。

効果的なチェーンは、しばしばPythonで書かれた「接着剤コード」を利用する Python または LangChainのようなオーケストレーションライブラリによって管理され、 ステップ間のデータ変換を処理します。これにより、 物体検出の視覚的精度と 生成テキストモデルの言語的流暢さといった、 異なる技術の統合が可能になります。

実際のアプリケーション

プロンプトチェイニングは、異なるデータモダリティ間のギャップを埋める際に特に強力であり、 マルチモーダルモデルが動的な産業・商業環境で機能することを可能にする。

  1. 自動視覚レポート: スマート製造において、品質管理システムはビジョンモデルとLLMを連携させることができる。まず、Ultralytics 高速モデルが組立ライン上の部品をスキャンする。 構造化された出力(例:「クラス: Dented_Can、信頼度: 0.92」)はテキスト文字列に変換される。このテキストは「この欠陥に基づいて保守依頼書を作成せよ」といったプロンプトと共に言語モデルへ渡され、現場管理者向けの人が読めるメールを生成する。
  2. コンテキスト認識型カスタマーサポート:インテリジェントチャットボットは、複雑なユーザークエリを処理するためにチェーニングを頻繁に利用します。 チェーンの最初のリンクでは、 自然言語処理(NLP)を用いて classify 意図をclassify 。技術的な意図と判断された場合、システムは 検索拡張生成(RAG)ワークフローを起動する: クエリの埋め込みを生成し、 ベクトルデータベースからドキュメントを検索し、 最後にLLMにプロンプトを発行して 取得した情報を統合し有用な回答を生成させる。

視覚から言語へのコード例

以下の例は、一連のプロセスの最初の「リンク」を示しています: コンピュータビジョン(CV)を用いて構造化データを生成し、 下流のプロンプトのコンテキストとして機能させることです。

from ultralytics import YOLO

# Load the YOLO26 model (natively end-to-end and highly efficient)
model = YOLO("yolo26n.pt")

# Step 1: Run inference to 'see' the environment
results = model("https://ultralytics.com/images/bus.jpg")

# Step 2: Format visual detections into a natural language string
det_names = [model.names[int(c)] for c in results[0].boxes.cls]
prompt_context = f"The scene contains: {', '.join(det_names)}. Please describe the likely activity."

# The 'prompt_context' variable is now ready to be sent to an LLM API
print(prompt_context)

関連概念の区別

効果的な機械学習(ML)アーキテクチャを実装するには、AI分野における類似用語とプロンプトチェーニングを区別することが有用である:

  • 思考連鎖プロンプティング: 思考連鎖(CoT)は、単一のプロンプト内でモデルに「思考過程を示す」(例:「段階的に考えよ」)よう促す技法である。プロンプト連鎖は複数の独立したAPI呼び出しを伴い、ステップBへの入力はステップAの出力を依存とする。
  • プロンプトエンジニアリング プロンプトエンジニアリングとは、モデル性能を向上させるために入力テキストを最適化する広範な分野である。 チェーニングは、操作と論理制御の連続的な流れに焦点を当てた特定のエンジニアリングパターンである。
  • 対プロンプトチューニングプロンプトチューニングは、学習可能なパラメータ(ソフトプロンプト)をトレーニング段階で更新するモデル最適化手法である。プロンプトチェイニングは完全にリアルタイム推論中に発生し、モデルの重みを変更しない。

プロンプトチェイニングを活用することで、チームはロジック、データ取得、および アクション認識を統合した堅牢なアプリケーションを構築できます。 これらのチェーンを支えるデータセットの管理と ビジョンモデルのトレーニングのために、 Ultralytics アノテーション、 トレーニング、デプロイメントのための一元化されたソリューションを提供します。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加