用語集

ナレッジグラフ

複雑な関係性をモデル化し、セマンティック検索やパーソナライズされたレコメンデーションなどを可能にするナレッジグラフが、AIにどのような革命をもたらすかをご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

知識グラフは、現実世界の実体(人、場所、概念など)を結びつけ、それらの関係を記述することによって情報を整理する。これはネットワークや知識の地図と考えることができ、点は実体を表し、線はそれらがどのように関連しているかを表す。この構造化されたアプローチにより、人工知能(AI)システム、特に機械学習(ML)システムは、生のテキストやサイロ化されたデータベースを単に検索するよりも、文脈を理解し、推論を導き、よりインテリジェントに情報にアクセスすることができる。

コア・コンセプト

知識グラフは、ノード(エンティティまたは概念を表す)とエッジ(これらのノード間の関係を表す)を使用して構築されます。例えば、あるノードはUltralytics YOLO」、別のノードは「Object Detection」で、「is a type of」とラベル付けされたエッジで接続される。この構造は、複雑なクエリーと推論機能を可能にし、システムが既存のデータから新しい事実を推論することを可能にする。リソース記述フレームワーク(RDF)のような技術は、データ交換のための標準モデルを提供し、SPARQLのようなクエリ言語は、ユーザがこれらの関係に基づいて情報を検索することを可能にする。KGの構築には、構造化データベースや非構造化テキストを含む様々なソースから情報を抽出することが多く、時には自然言語処理(NLP)技術を使用し、複雑な推論システムを伴う可能性もある。

ナレッジグラフと他の概念

ナレッジグラフは他のデータ構造と関連しているが、明確な特徴を持っている:

  • データベース:従来のリレーショナル・データベースは、あらかじめ定義されたスキーマを持つテーブルにデータを格納し、構造化されたレコードの効率的な格納と検索に重点を置いている。KGは、複雑で、しばしば異質な関係を表現し、新しい知識を推論することに優れている。
  • オントロジー: オントロジーは、あるドメインの語彙とルール(スキーマ)を定義し、エンティティのタイプと関係を指定する。知識グラフはオントロジーのインスタンスであることが多く、これらのルールに従って特定の事実を表現する。ウェブ・オントロジー言語(OWL)は、オントロジーを定義するための一般的な標準である。
  • ベクトルデータベースデータを高次元ベクトル(埋め込み)として格納し、意味的な類似性を把握する。類似項目を見つけるのに優れているが、KGのように明示的に関係を定義しない。KGは明示的で事実に基づいたつながりを保存する。

AI/MLへの応用

ナレッジグラフは、多くのインテリジェント・アプリケーションに力を与える:

  • 検索結果の強化: Google ような検索エンジンは、KG(Google Knowledge Graphのような)を使用して、検索クエリを意味的に理解し、情報パネルで直接的な回答、要約、関連するエンティティを提供し、単純なキーワードマッチングを超えて、より良いセマンティック検索を可能にします。
  • 推薦システムプラットフォームは、KGを使用して、ユーザー、商品、コンテンツ、およびそれらの属性(ジャンル、俳優、監督など)間のつながりをモデル化する。これにより、発見された関係性に基づくより微妙なレコメンデーションが可能になり、ファッション小売におけるAIのような分野でユーザー体験を向上させる。
  • コンテクスチュアルAI: コンピュータ・ビジョン(CV)において、特定の建物のような物体を検出すること。 Ultralytics YOLOモデル YOLOv8のようなUltralyticsのYOLOモデルを使用して特定の建物のようなオブジェクトを検出すると、その建物の歴史、建築家、営業時間などを取得するためのKGクエリーがトリガーされ、アプリケーションの理解を深めることができる。このコンテキストデータは、Ultralytics HUBのようなプラットフォームで管理・利用することができる。KGはまた、構造化された背景知識を提供することで、質問応答システムを強化する。
  • 創薬:KGは、多様な生物学的データ(遺伝子、タンパク質、疾患、薬剤)を統合し、研究者が潜在的な創薬ターゲットや相互作用を特定するのを支援し、ヘルスケアにおけるAIソリューションを加速させる。

ナレッジグラフの構築と活用

KGの作成と管理には、自動抽出技術、手作業によるキュレーション、またはその組み合わせが含まれる。DBpedia(Wikipediaから派生)やWikidataのようなオープンソースのナレッジグラフは、膨大な量の構造化データを提供する。Neo4jのような専門的なグラフデータベース技術は、グラフデータを効率的に格納し、クエリするように設計されている。MLモデルは、エンティティ認識や関係抽出のようなタスクにますます使用され、テキストや、様々なコンピュータビジョンデータセットから得られるビジュアルデータから、自動的にKGを生成する。

すべて読む