用語集

ナレッジグラフ

複雑な関係性をモデル化し、セマンティック検索やパーソナライズされたレコメンデーションなどを可能にするナレッジグラフが、AIにどのような革命をもたらすかをご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

ナレッジグラフは、現実世界のエンティティ(人、場所、組織、概念など)を結びつけ、それらの関係を記述することで情報を整理する。それは知識のインテリジェントマップのように機能し、点は実体を表し、それらを結ぶ線はそれらがどのように関連しているかを表す。この構造化されたアプローチは、人工知能(AI)や機械学習(ML)システムにとって非常に重要であり、構造化されていないテキストや孤立したデータベースを検索するよりも、文脈を理解し、推論を導き、より効率的に情報にアクセスすることができる。KGは、多くの高度なAIアプリケーションにセマンティックなバックボーンを提供している。

コア・コンセプト

知識グラフは、ノード(エンティティまたは概念を表す)とエッジ(これらのノードを接続する関係または述語を表す)で構成されます。例えば、あるノードはUltralytics YOLO」であり、別のノードは「Object Detection」であるかもしれない。「is a type of」とラベル付けされたエッジがそれらを接続することができる。この構造により、複雑な関係を照会したり、既存の接続データから新しい事実を推論するなどの推論タスクを実行することができる。リソース記述フレームワーク(RDF)のような標準はデータ表現のための共通モデルを提供し、SPARQLのようなクエリ言語はグラフパターンに基づいた情報検索を可能にする。KGの構築には、構造化データ(データベースのような)や非構造化テキストを含む多様なソースから情報を抽出することが多く、自然言語処理(NLP)技術や潜在的に複雑な推論システムを頻繁に利用する。データ品質とデータガバナンスは、信頼できるKGを維持するために不可欠である。

ナレッジグラフと他の概念

ナレッジグラフは、他のデータ整理手法と関連しながらも、ユニークな特徴を持っている:

  • オントロジーオントロジーは、特定のドメイン(スキーマまたは設計図)内のエンティティのタイプ、プロパティ、相互関係を正式に定義する。KGは構造的な基盤としてオントロジーを使用することが多いが、実際のインスタンスデータ(特定の事実やエンティティ)も含んでいる。オントロジーの定義には、ウェブオントロジー言語(OWL)のような言語が使用される。
  • 分類学:分類学は階層的な分類システムである(例えば、動物を王国、門、綱で分類する)。KGはより柔軟で、厳密には階層的ではない複雑な多関係ネットワークを表す。
  • ベクトルデータベースこれらのデータベースは、類似性検索(ベクトル検索)に最適化された数値埋め込みとしてデータを格納する。逆に、KGは、エンティティ間の明示的で象徴的な関係を表す。KGはベクトル検索で取得した情報に構造化されたコンテキストを提供することができる。

AI/MLへの応用

知識グラフは、数多くのインテリジェント・アプリケーションに不可欠である:

  • セマンティック検索 Google ような検索エンジンは、クエリの背後にある意図を理解し、単純なキーワードマッチングを超えて、より関連性の高い、文脈に基づいた結果を提供するためにKG(例えば、Google Knowledge Graph)を使用しています。
  • レコメンデーションシステムユーザー、アイテム、およびそれらの属性間の関係をモデル化することで、KGはeコマース(小売におけるAI)やコンテンツ・ストリーミングのような分野において、より洗練されたパーソナライズされたレコメンデーションを可能にする。
  • 質問応答と チャットボットKGは、AIシステムがエンティティの関係をナビゲートすることによって複雑な質問に答えることを可能にする構造化された知識を提供し、会話AI能力を強化する。
  • データ統合:KGは、異種ソースからのデータを統合し、組織全体の情報の一貫した相互接続されたビューを作成することができます。これはビッグデータ分析に不可欠です。
  • 他のAIモデルを強化する:KGは他のAIタスクに文脈的な背景知識を提供することができる。例えば、コンピュータ・ビジョン(CV)において、KGは以下のようなモデルによって検出された物体を結びつけることができる。 Ultralytics YOLOv8のようなモデルによって検出されたオブジェクトを、それらの特性、機能、または相互作用に関する関連情報と結びつけることができ、より豊かなシーン理解につながります。Ultralytics HUBのようなプラットフォームは、潜在的にKGに入力したり、活用したりできるデータセットやモデルを管理しています。

実例

  1. Eコマースのパーソナライゼーション:あるオンライン小売業者は、顧客、商品、ブランド、カテゴリー、閲覧履歴、購入データ、商品レビューを結びつけるナレッジグラフを使用している。ユーザーが「ランニングシューズ」を検索すると、KGは関連する概念(例:「マラソン」、「トレイルランニング」、特定のブランド)やユーザーの嗜好(過去の購入履歴、閲覧した商品)を理解し、高度にパーソナライズされた検索結果や、アパレルやアクセサリーのような補完的な商品の推奨を提供します。これにより、顧客体験が向上する。
  2. ヘルスケアにおけるAIソリューションある医療研究機関は、病気、症状、遺伝子、タンパク質、薬、臨床試験、(PubMedに索引付けされたような)研究論文を結びつける知識グラフを構築する。これにより、研究者や臨床医は、「タンパク質Xを標的とし、疾患Yの治療に使用される薬剤を検索する」といった複雑な関係をクエリできるようになり、創薬が加速され、相互接続された症状や患者データに基づく診断の意思決定支援が提供され、医療画像分析が改善される可能性がある。
すべて読む