Yolo 深圳
深セン
今すぐ参加
用語集

ベクトルデータベース

ベクトルデータベースが意味的検索のために高次元埋め込みを管理する方法を発見してください。Ultralytics と類似性検索でAIアプリケーションを強化する方法を学びましょう。

ベクトルデータベースは、高次元ベクトルデータ(一般に埋め込みと呼ばれる)を管理、索引付け、検索するために設計された特殊なストレージシステムである。構造化データを正確なキーワード一致のために行と列に整理する従来のリレーショナルデータベースとは異なり、ベクトルデータベースは意味的検索に最適化されている。これにより、インテリジェントシステムは同一ではなく概念的に類似したデータポイントを見つけることが可能となる。 この機能は現代の人工知能(AI)インフラの基盤であり、画像・音声・動画・テキストといった非構造化データを、それらの間の数学的関係を分析することで処理・理解することをアプリケーションに可能にします。これらのデータベースは知能エージェントの長期記憶として機能し、ビジュアル検索やパーソナライズド推薦といったタスクを促進します。

ベクトルデータベースの仕組み

ベクトルデータベースの機能は、ベクトル空間の概念を中心に展開される。この空間では、データ項目が多次元座標系上の点としてマッピングされる。プロセスは特徴抽出から始まり、深層学習(DL)モデルが生データを入力として数値ベクトルに変換する。

  1. 取り込み:データは最先端のYOLO26などのニューラルネットワークによって処理され、埋め込みを生成する。これらのベクトルは入力の意味的意味を浮動小数点数の密なリストに圧縮する。
  2. インデックス作成:検索時の推論遅延を低減するため、データベースは特殊なアルゴリズムを用いてこれらのベクトルを整理します。階層的ナビゲーション可能なスモールワールド(HNSW) や逆ファイルインデックス(IVF)といった技術により、システムは数十億のベクトルを効率的に探索でき、すべてのエントリをスキャンする必要がありません。
  3. クエリ処理:ユーザーが検索クエリ(例:特定の靴スタイルの画像)を送信すると、システムは クエリをベクトルに変換し、コサイン類似度や ユークリッド距離などの距離測定法を用いて 保存済みベクトルとの近接度を計算する。
  4. 検索:データベースは「最近傍」を返します。これは文脈的に最も関連性の高い結果を表します。

以下のPython は、標準的な手法を用いて埋め込みを生成する方法を示しています。 ultralytics モデル、 これはベクトルデータベースを構築する前に必要な前提ステップです。

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Generate feature embeddings for an image file
# The 'embed' method creates the vector representation needed for the database
results = model.embed("https://ultralytics.com/images/bus.jpg")

# Output the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")

実際のアプリケーション

ベクトルデータベースは、今日の企業環境で使用される多くの高度な コンピュータビジョン(CV)および 自然言語処理(NLP)アプリケーションを支える基盤技術である。

  • 検索拡張生成(RAG): 生成AIの時代において、ベクトルデータベースは大規模言語モデル(LLM)が膨大なプライベートで最新のデータライブラリにアクセスすることを可能にする。ユーザーの入力文の意味に基づいて関連文書を検索することで、システムはLLMの幻覚現象を低減し、事実に基づいた文脈認識型の応答を提供する。
  • ビジュアルレコメンデーションエンジン: 小売業界におけるAIでは、プラットフォームがベクトルデータベースを活用し「類似スタイルの商品を閲覧」機能を実現している。ユーザーが特定のサマードレスを閲覧すると、システムはデータベースに対し、類似したビジュアル埋め込み(パターン・カット・カラーが一致する)を持つ他の商品画像を照会する。これにより、単純なタグベースのフィルタリングよりも優れたユーザー体験を提供する。
  • 異常検知と脅威検知:セキュリティシステムは異常検知にベクトルデータベースを活用する。 「正常」な動作や許可された要員の埋め込み値を保存することで、システムはベクトル空間内の予想されるクラスター外に存在する外れ値を即座にフラグ付けでき、 データセキュリティと施設監視を強化する。

関連概念の区別

これらのシステムを効果的に実装するには、機械学習運用(MLOps)の領域において、ベクトルデータベースを関連技術と区別することが有用である。

  • ベクトルデータベース対ベクトル検索 ベクトル検索とは、類似するベクトルを見つける操作またはアルゴリズム的プロセス(「方法」)である。 ベクトルデータベースとは、データを保存し、インデックスを管理し、これらの検索を大規模に実行するために構築された堅牢なインフラストラクチャ(「場所」)である。
  • ベクトルデータベース対特徴ストア 特徴ストアは、モデルトレーニングと推論で使用される特徴を管理し一貫性を確保するための集中型リポジトリである。 特徴データを扱う一方で、ベクトルデータベースを定義する類似性ベースの検索クエリに対して主に最適化されているわけではない。
  • ベクトルデータベース対データレイク データレイクは、膨大な量の生データをネイティブ形式で保存します。 ベクトルデータベースは、そのデータの処理済み数学的表現(埋め込み)を保存し、 特に類似性検索向けに最適化されています。

最新のAIワークフローとの統合

ベクターデータベースの実装では、効率的なYOLO26のようなモデルが埋め込みエンジンとして機能するパイプラインが頻繁に用いられる。これらのモデルはエッジまたはクラウド上で視覚データを処理し、生成されたベクターはPineconeMilvusQdrantなどのソリューションにプッシュされる。

データキュレーションや自動アノテーションからモデルトレーニング、デプロイメントに至るまでのライフサイクル全体を効率化したいチーム向けに、Ultralytics は包括的な環境を提供します。モデルトレーニングと効率的なデプロイ戦略を統合することで、開発者はベクトルデータベースに供給される埋め込みデータが正確であることを保証でき、結果として高品質な検索結果とより賢いAIエージェントを実現します。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加