用語集

ベクトル検索

NLP、ビジュアル検索、推薦システムなどのデータ検索における意味的類似性を可能にするベクトル検索が、AIにどのような革命をもたらすかをご覧ください！

ベクトル検索とは、データを埋め込みと呼ばれる数値ベクトルとして表現することで、大規模なデータセットから類似の項目を見つけ出す手法である。正確なキーワードにマッチする代わりに、意味的または文脈的に類似した項目を特定する。このアプローチは現代の人工知能（AI）システムの基本であり、画像、テキスト、音声のような複雑なデータタイプに対して、より直感的で正確な情報検索を可能にする。文字通りのクエリを超えて、根本的な意味や意図を理解するため、洗練された検索エンジンや推薦エンジンを構築するための強力なツールとなる。

ベクトルサーチの仕組み

ベクトル検索のプロセスには、生データを意味に基づいて検索可能な形式に変換するいくつかの重要なステップが含まれる。これはディープラーニングモデルと効率的なアルゴリズムによって支えられている。

エンベッディングを生成する：まず、変換器や畳み込みニューラルネットワーク（CNN）のような機械学習モデルが、データアイテム（例：文章、画像、ユーザープロファイル）をエンベッディングと呼ばれる高次元の数値ベクトルに変換する。各ベクトルはアイテムの意味的な本質を捉える。
インデックス作成：生成されたベクトルは、専用のベクトルデータベースに保存され、インデックスが付けられます。Pineconeや Milvusのようなこれらのデータベースは、膨大な量のベクトルデータを効率的に管理し、照会するために最適化されています。
クエリ：ユーザーがクエリ（テキストフレーズや画像など）を送信すると、同じモデルを使用してベクトルに変換される。
類似度計算：次に、システムはアルゴリズムを使用して、クエリベクトルに「最も近い」データベース内のベクトルを見つけます。これはコサイン類似度やユークリッド距離のような距離測定基準を用いて行われることが多い。膨大なデータセットを処理するために、システムは一般的にScaNNや Faissのような近似最近傍（ANN）アルゴリズムを使用し、完全一致ではないにせよ、関連性の高いものを高速かつスケーラブルに検索します。

実世界での応用

ベクトル検索は、多くの高度なAI機能を支えるテクノロジーである。これにより、システムは単純なマッチングを超え、様々な業界において文脈を考慮した結果を提供することができる。

セマンティック画像検索：手動タグやファイル名に依存する代わりに、ユーザーは説明的な自然言語フレーズを使用して画像を検索することができます。例えば、ユーザーが「夕暮れの山道を走る車」と検索すると、システムは「車」、「山」、「夕暮れ」の概念を文脈から理解し、視覚的に類似した画像を検索します。Ultralyticsの類似検索ガイドで、この仕組みを調べることができます。
レコメンデーションシステム：Eコマースやストリーミング・プラットフォームは、ベクトル検索を使って商品やコンテンツを推薦する。SF映画を見た場合、ベクトル埋め込みを比較することで、ジャンルやトーン、プロットが似ている他の映画を見つけ、提案することができる。これは、ユーザーエクスペリエンスとエンゲージメントを向上させる小売業におけるAIの中核機能である。