术语表

知识图谱

了解知识图谱如何通过对复杂关系建模、实现语义搜索和个性化推荐等彻底改变人工智能。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

知识图谱通过连接现实世界中的实体(如人、地点或概念)并描述它们之间的关系来组织信息。把它想象成一个网络或知识地图,其中点代表实体,线代表它们之间的关系。这种结构化的方法使人工智能(AI)系统,尤其是机器学习(ML)系统,能够理解上下文、得出推论,并更智能地获取信息,而不是简单地搜索原始文本或孤立的数据库。

核心理念

知识图谱使用节点(代表实体或概念)和边(代表这些节点之间的关系)来构建。例如,一个节点可以是Ultralytics YOLO",另一个节点是 "Object Detection",通过标有 "is a type of "的边连接起来。这种结构允许复杂的查询和推理功能,使系统能够从现有数据中推断出新的事实。资源描述框架(RDF)等技术为数据交换提供了标准模型,而SPARQL等查询语言则允许用户根据这些关系检索信息。构建 KG 通常需要从各种来源(包括结构化数据库和非结构化文本)中提取信息,有时需要使用自然语言处理(NLP)技术,并可能涉及复杂的推理系统

知识图谱与其他概念的对比

知识图谱虽然与其他数据结构相关,但也有其独特之处:

  • 数据库:传统的关系数据库将数据存储在具有预定义模式的表格中,侧重于结构化记录的高效存储和检索。KG 擅长于表示复杂的、往往是异构的关系,并推断新的知识,而这在标准数据库中并不那么简单。
  • 本体 本体定义了一个领域的词汇和规则(模式),规定了实体的类型和关系。知识图谱通常是本体的一个实例,根据这些规则表示具体事实。网络本体语言(OWL)是定义本体的通用标准。
  • 矢量数据库这些数据库将数据存储为高维向量(嵌入),捕捉语义相似性。它们非常适合查找相似项目,但不像 KG 那样明确定义关系。KG存储的是明确的事实联系。

人工智能/移动语言的应用

知识图谱为许多智能应用提供了动力:

  • 增强搜索结果: Google 等搜索引擎使用 KG(如Google 知识图谱)从语义上理解搜索查询,并在信息面板中提供直接答案、摘要和相关实体,超越了简单的关键词匹配,实现了更好的语义搜索
  • 推荐系统平台使用 KGs 对用户、产品、内容及其属性(如类型、演员、导演)之间的联系进行建模。这样就可以根据发现的关系进行更细致的推荐,从而改善用户体验,如时尚零售业的人工智能
  • 上下文人工智能:计算机视觉 (CV) 中,使用超光谱分析技术检测物体,如特定建筑物。 Ultralytics YOLO模型(如 YOLOv8可以触发 KG 查询,检索其历史、建筑师或开放时间,从而丰富应用程序的理解。这种上下文数据可以在Ultralytics HUB 等平台中进行管理和利用。通过提供结构化背景知识,KG 还能增强问题解答系统。
  • 药物发现:KGs 整合各种生物数据(基因、蛋白质、疾病、药物),帮助研究人员确定潜在的药物靶点和相互作用,加速医疗保健领域的人工智能解决方案

构建和使用知识图谱

创建和维护知识图谱可以采用自动提取技术、人工整理或两者结合的方式。DBpedia(源自维基百科)和Wikidata等开源知识图谱提供了大量结构化数据。Neo4j等专业图数据库技术旨在高效地存储和查询图数据。ML 模型越来越多地用于实体识别和关系抽取等任务,以便从文本甚至从各种计算机视觉数据集获得的视觉数据中自动填充知识图谱

阅读全部