用語集

リトリーバル・オーグメンテッド・ジェネレーション(RAG)

検索モデルと生成モデルを統合し、正確で文脈に富んだテキストを生成します。最先端のAIを今すぐご覧ください!

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

検索拡張生成(RAG)は、検索システムと生成モデルの長所を組み合わせ、より正確で文脈に関連したテキストの生成を強化する、自然言語処理(NLP)の最先端のアプローチである。この革新的な手法は、従来の言語モデルの限界に対処するもので、特定の詳細や文脈を欠くテキストを生成することがある。

RAGの仕組み

RAGシステムはまず、与えられたクエリに基づいてデータベースや文書のコレクションから関連情報を検索する。この検索ステップにより、システムは生成プロセスを豊かにする豊富な外部データにアクセスできるようになる。最も適切な情報が検索されると、生成モデルはこのデータを使用して、外部ソースから情報を得たテキストを生成する。このプロセスにより、生成された出力は流暢であるだけでなく、事実に基づいて正確で、文脈に適したものとなる。

主要コンポーネント

  • 検索システム:このコンポーネントは、関連する情報のスニペットを見つけるために大規模なデータセットを検索する。このようなシステムの例としては、Elasticsearchや、検索モデルがクエリできる特殊なデータベースがある。
  • 生成モデル:通常、GPTやBERTなどの大規模言語モデル(LLM)に基づき、生成モデルは検索された情報を活用してテキストを生成する。

関連性と応用

RAGは、正確さと文脈が最も重要なシナリオにおいて特に重要である。これは、以下のような用途において極めて重要である:

  • 質問回答:事実情報のデータベースに基づくことで、回答の正確性を高める。
  • カスタマーサポート:ナレッジベースへのアクセスにより、詳細かつ正確な回答を提供。
  • コンテンツの作成:最新かつ適切な情報を反映した有益なコンテンツの作成。

RAGと類似概念の区別

RAGは、検索ベースのモデルや生成モデルと独立して類似しているが、単独で使用された場合にそれぞれに見られる限界を克服するために、両方のコンポーネントを独自に統合している。首尾一貫した、しかし潜在的に不正確なテキストを生成することに悩まされるかもしれない純粋な生成モデルとは異なり、RAGは検索されたデータに生成の根拠を置くことによって正確さを保証する。

実例

例1:カスタマー・サポート・システム

カスタマーサポートのアプリケーションでは、RAGを使用して社内のナレッジベースからデータを取得することで、顧客からの問い合わせに対して正確な回答を自動的に提供することができます。これにより、回答が適切であり、会社のポリシーに準拠していることが保証され、効率と顧客満足度が大幅に向上します。

例 2:研究支援

RAGは研究環境でも採用されており、最新の研究論文に基づいて文献レビューや要約を生成することで研究者を支援している。最新の情報を検索して取り込むことで、このモデルは生成されるテキストが包括的で事実に基づいて正しいことを保証する。

さらなる探求

検索拡張世代は、AI技術の進化を例証するものであり、様々な領域においてよりスマートで信頼性の高いソリューションを約束するものである。これらのシステムが進化を続けるにつれて、正確でデータ主導の洞察を提供する能力が高まり、情報へのアクセスや活用の方法が変化することが期待される。

すべて読む