用語集

ベクトル検索

NLP、ビジュアル検索、推薦システムなどのデータ検索における意味的類似性を可能にするベクトル検索が、AIにどのような革命をもたらすかをご覧ください!

ベクトル検索とは、データを埋め込みと呼ばれる数値ベクトルとして表現することで、大規模なデータセットから類似の項目を見つけ出す手法である。正確なキーワードにマッチする代わりに、意味的または文脈的に類似した項目を特定する。このアプローチは現代の人工知能(AI)システムの基本であり、画像、テキスト、音声のような複雑なデータタイプに対して、より直感的で正確な情報検索を可能にする。文字通りのクエリを超えて、根本的な意味や意図を理解するため、洗練された検索エンジンや推薦エンジンを構築するための強力なツールとなる。

ベクトルサーチの仕組み

ベクトル検索のプロセスには、生データを意味に基づいて検索可能な形式に変換するいくつかの重要なステップが含まれる。これはディープラーニングモデルと効率的なアルゴリズムによって支えられている。

  1. エンベッディングを生成する:まず、変換器や 畳み込みニューラルネットワーク(CNN)のような機械学習モデルが、データアイテム(例:文章、画像、ユーザープロファイル)をエンベッディングと呼ばれる高次元の数値ベクトルに変換する。各ベクトルはアイテムの意味的な本質を捉える。
  2. インデックス作成:生成されたベクトルは、専用のベクトルデータベースに保存され、インデックスが付けられます。Pineconeや Milvusのようなこれらのデータベースは、膨大な量のベクトルデータを効率的に管理し、照会するために最適化されています。
  3. クエリ:ユーザーがクエリ(テキストフレーズや画像など)を送信すると、同じモデルを使用してベクトルに変換される。
  4. 類似度計算:次に、システムはアルゴリズムを使用して、クエリベクトルに「最も近い」データベース内のベクトルを見つけます。これはコサイン類似度やユークリッド距離のような距離測定基準を用いて行われることが多い。膨大なデータセットを処理するために、システムは一般的にScaNNや Faissのような近似最近傍(ANN)アルゴリズムを使用し、完全一致ではないにせよ、関連性の高いものを高速かつスケーラブルに検索します。

実世界での応用

ベクトル検索は、多くの高度なAI機能を支えるテクノロジーである。これにより、システムは単純なマッチングを超え、様々な業界において文脈を考慮した結果を提供することができる。

  • セマンティック画像検索手動タグやファイル名に依存する代わりに、ユーザーは説明的な自然言語フレーズを使用して画像を検索することができます。例えば、ユーザーが「夕暮れの山道を走る車」と検索すると、システムは「車」、「山」、「夕暮れ」の概念を文脈から理解し、視覚的に類似した画像を検索します。Ultralyticsの類似検索ガイドで、この仕組みを調べることができます。
  • レコメンデーションシステムEコマースやストリーミング・プラットフォームは、ベクトル検索を使って商品やコンテンツを推薦する。SF映画を見た場合、ベクトル埋め込みを比較することで、ジャンルやトーン、プロットが似ている他の映画を見つけ、提案することができる。これは、ユーザーエクスペリエンスとエンゲージメントを向上させる小売業におけるAIの中核機能である。

ベクトル検索と関連概念

AIエコシステムにおける特定の役割を理解するためには、ベクトル検索を他の関連用語と区別することが役に立つ。

  • キーワード検索:従来のキーワード検索は、正確な単語やフレーズとのマッチングに頼っていた。同義語や文脈、言語的なニュアンスに苦労する。対照的に、ベクトル検索は、意味的な関係を理解し、キーワードが完全に一致しなくても、関連する結果を見つけることができます。
  • セマンティック検索:セマンティック検索とは、クエリの意図や文脈上の意味を理解するという広い概念である。ベクトル検索は、セマンティック検索を実装するために使用される中核的な手法である。セマンティック検索が「何」(意味の理解)であるのに対し、ベクトル検索は「どのように」(ベクトルの近接性に基づく検索メカニズム)である。
  • 埋め込み: 埋め込みはデータのベクトル表現である。ベクトル検索は、エンベッディングのコレクションを照会して、最も類似したものを見つけるプロセスです。エンベッディングはデータであり、ベクトル検索はそのデータに対して実行されるアクションです。
  • ベクトルデータベース: ベクトルデータベースは、埋め込みデータを保存し、インデックスを付け、効率的にクエリするための特別なインフラストラクチャです。Ultralytics HUBのようなプラットフォームは、ベクトル検索システムで使用するエンベッディングを生成するデータセットとモデルの管理を支援します。

エンベッディングと洗練された検索アルゴリズムのパワーを活用することで、ベクトル検索は人間の意図とデジタルデータとのギャップを埋め、自然言語処理(NLP)から高度なコンピュータビジョンタスクに至るまで、多くのインテリジェントアプリケーションにとって不可欠なコンポーネントとなっている。

Ultralyticsコミュニティに参加する

AIの未来に参加しませんか。世界のイノベーターとつながり、協力し、成長する

今すぐ参加する
クリップボードにコピーされたリンク