ベクトル検索は、人工知能(AI)や機械学習(ML)において、ベクトル表現に基づいてデータ点を検索するように設計された強力な手法である。完全一致や単純な文字列比較に依存する従来のキーワードベースの検索とは異なり、ベクトル検索は多次元ベクトル空間内のデータポイントの近接性や類似性に着目する。このアプローチは、画像、音声、テキストなどの非構造化データを含むアプリケーションに特に有効である。
ベクトル検索の核心は、データをベクトル表現、つまりデータの意味や特徴を捉えた数値配列に変換することである。例えば、BERTのような自然言語処理(NLP)モデルは、文のベクトル埋め込みを生成し、高次元空間における文脈と意味を捉えます。同様に、画像分類のようなコンピュータ・ビジョンのタスクでは、以下のようなモデルが画像の特徴埋め込みを生成します。 Ultralytics YOLOは画像の特徴埋め込みを生成します。
データがベクトルとして表現されると、ベクトル検索アルゴリズムは、コサイン類似度やユークリッド距離のような類似性尺度を用いて、与えられたクエリ・ベクトルに最も近いデータ点を特定する。これにより、完全な一致がない場合でも、意味的または文脈的に類似した結果を検索することが可能になる。
ベクトル検索は、ユーザーの嗜好に基づいて商品やコンテンツ、サービスを提案するレコメンデーション・エンジンに広く使われている。例えば
ユーザーが画像やオブジェクトを検索するアプリケーションでは、ベクトル検索は視覚的特徴に基づく効率的な検索を可能にする:
ベクトル検索はNLPのセマンティック検索を強化し、検索エンジンとチャットボットを強化する:
サイバーセキュリティや金融のような業界では、ベクトル検索は外れ値や異常値を検出するために適用される:
大規模なベクトル検索を行うには、専用のツールやフレームワークが使われることが多い。Milvusや Pineconeのようなベクトルデータベースは、大規模で高次元のベクトルデータを効率的に扱うように設計されている。これらのシステムは、近似最近傍(ANN)アルゴリズムを活用して検索性能を高速化し、リアルタイムアプリケーションに適しています。
さらに、主成分分析(PCA)のような技術による次元削減のような前処理ステップは、意味のある関係を保持しながらサイズを縮小することによって、ベクトルデータの保存と検索を最適化することができる。
自律走行車は、リアルタイムで周囲の状況を処理・分析するためにベクトル探索に依存している。例えば
人材獲得では、候補者と職務内容をマッチングさせるためにベクトル検索が採用される:
ベクトル検索は、AIシステムがテキストや画像から音声や動画に至るまで、様々なデータ型にわたって類似性に基づく検索を行うことを可能にする革新的なテクノロジーである。高度な埋め込みと類似性測定を活用することで、ベクトル検索は、パーソナライズされたレコメンデーションから異常検知まで、幅広いアプリケーションを容易にします。Ultralytics HUB のようなツールを使用して、ビジョン AI 機能をプロジェクトにシームレスに組み込んでください。