术语表

语义搜索

探索语义搜索的力量!了解人工智能、NLP 和 ML 如何通过理解用户意图和上下文来提高搜索准确性。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

语义搜索是信息检索领域的一大进步,它超越了简单的关键词匹配,能够理解用户查询背后的意图和语境含义。语义搜索不只是查找字面意思,而是利用人工智能(AI)技术,特别是自然语言处理(NLP)技术,来把握语言的细微差别、词语之间的关系以及用户的基本目标。这样,搜索系统就能通过解释用户想要查找的内容,而不仅仅是他们键入的特定术语,提供更相关、更准确的结果。它是使信息系统(从网络搜索到内部知识库)交互更加自然和直观的核心组成部分,从根本上提高了信息检索的效率。

语义搜索如何工作

语义搜索的核心是利用 NLP 和机器学习 (ML)的概念来解读文本或其他数据类型中蕴含的意义。这一过程通常涉及将数据(如单词、句子、文档甚至图像)转换为称为嵌入的数字表示。这些嵌入通常是高维向量,可以捕捉数据的语义本质。在这个向量空间中,具有相似含义、概念或语境的项目会被放置在更近的位置。

当用户执行搜索时,他们的查询(可以是自然语言文本、图像等)也会使用相同的 ML 模型转换成嵌入。然后,系统会采用向量搜索技术(通常由PineconeMilvus 等专业向量数据库提供支持),在索引中有效地找到嵌入式与查询嵌入式最接近(最相似)的项目。这种相似度通常使用余弦相似度欧氏距离等距离度量。先进的深度学习(DL)模型,包括转换器(如BERT)等架构,经常被用来生成这些强大的上下文感知嵌入。多年来,Google 搜索等主要搜索引擎已将语义理解纳入其中,以提高搜索结果的质量,而不仅仅是简单的关键词频率。

语义搜索的应用

语义搜索可增强各种应用,在这些应用中,理解用户意图或数据上下文至关重要:

  • 增强网络搜索:超越关键词,了解搜索背后的主题和意图(例如,搜索 "冬季观赏北极光的最佳地点",会得到有关具体地点和理想时间的结果,而不仅仅是包含这些确切词语的网页)。
  • 电子商务产品发现:允许用户使用描述性的自然语言搜索产品(例如,寻找 "舒适的鞋子,适合整天站立",而无需知道具体品牌或产品名称)。这通常与推荐系统相结合。
  • 内部知识管理:通过基于概念和含义的搜索,使组织内的员工能够找到相关文档、报告或专业知识,从而提高Ultralytics HUB 等工具的信息获取能力。
  • 客户支持聊天机器人:聊天机器人虚拟助手提供动力,使其更好地理解用户问题,并提供更准确的答案或相关帮助文章,通常利用大型语言模型 (LLM)
  • 内容推荐:根据与用户之前互动内容的语义相似性推荐文章、视频或音乐。Spotify等平台也使用类似的概念。
  • 数据探索: Ultralytics Explorer Dashboard等工具可以利用语义相似性帮助用户浏览和理解大型数据集,包括计算机视觉(CV)中使用的图像数据集。例如,在COCO 等数据集中查找与所选图像语义相似的图像。

语义搜索与相关概念

将语义搜索与相关术语区分开来很有帮助:

  • 关键词搜索:这种传统方法是将查询中的字面单词或短语与包含这些精确术语的文档进行匹配。它缺乏对同义词、上下文或用户意图的理解。语义搜索旨在克服这些局限性。
  • 向量搜索这是一种根据矢量嵌入的接近程度来查找相似项目的方法。虽然向量搜索是许多现代语义搜索实现的核心组成部分(处理高效检索部分),但语义搜索是一个更广泛的概念,包括首先理解查询和数据的含义和上下文,通常是通过复杂的 NLP 模型来实现。
  • 知识图谱知识图谱将信息结构为实体和关系。通过提供结构化上下文和实现复杂的推理(SPARQL 查询在这里很常见),知识图谱可以极大地增强语义搜索,但语义搜索也可以直接使用嵌入式非结构化数据,而不使用显式图谱结构。它们是互补的技术。
  • 命名实体识别(NER)NER 识别文本中的特定实体(如名称、地点、组织)。它可以作为NLP 管道中的一个步骤,通过提取关键概念为语义搜索提供反馈,但它本身并不是语义搜索,语义搜索侧重于整体意义和相似性。

语义搜索在创建更加智能和用户友好的人工智能系统方面发挥着至关重要的作用,它在人类语言和机器理解之间架起了一座桥梁,从而在各个领域实现更有效的信息访问和交互,从日常网络搜索到专门的人工智能应用(如使用Ultralytics构建的应用),不一而足。 Ultralytics YOLO模型在Ultralytics HUB 中进行可视化搜索或分析的专业人工智能应用。

阅读全部