术语表

矢量搜索

了解矢量搜索如何通过基于相似性的数据检索为 NLP、视觉和异常检测等应用带来人工智能革命。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

矢量搜索是人工智能(AI)和机器学习(ML)领域的一项强大技术,旨在根据数据点的矢量表示检索数据点。与依赖精确匹配或简单字符串比较的传统关键字搜索不同,矢量搜索侧重于多维矢量空间内数据点的接近性或相似性。这种方法尤其适用于涉及非结构化数据(如图像、音频和文本)的应用。

了解矢量搜索

向量搜索的核心是将数据转换为向量表示--捕捉数据语义或特征的数字阵列。例如,自然语言处理(NLP)模型(如BERT)会为句子生成向量嵌入,捕捉高维空间中句子的上下文和含义。同样,在图像分类等计算机视觉任务中,BERT 等模型会为图像生成特征嵌入。 Ultralytics YOLO等模型为图像生成特征嵌入。

一旦数据被表示为向量,向量搜索算法就会使用余弦相似度或欧氏距离等相似度量来识别与给定查询向量最接近的数据点。这样,即使没有完全匹配的数据,也能检索到语义或上下文相似的结果。

矢量搜索的主要应用

推荐系统

矢量搜索广泛应用于推荐引擎,根据用户偏好推荐产品、内容或服务。例如

  • Netflix 和 Spotify 等流媒体平台利用深度学习模型生成的嵌入,使用向量搜索来推荐与用户观看或收听历史记录相符的电影或歌曲。
  • 亚马逊等电子商务平台采用矢量搜索,向用户推荐与其浏览或购买过的产品相似的产品。

视觉搜索

在用户搜索图像或对象的应用中,矢量搜索可根据视觉特征进行高效检索:

  • 一家时装零售商可能会允许顾客上传服装产品的照片,并使用矢量搜索来查找目录中的类似产品。
  • 在医疗保健领域,系统可以识别包含与查询图像相似模式的医学图像(如 X 光片或核磁共振成像),从而帮助诊断。了解有关医疗保健领域图像识别的更多信息

自然语言处理

矢量搜索为 NLP 中的语义搜索提供了动力,增强了搜索引擎和聊天机器人的功能:

  • 语义搜索引擎(如学术数据库使用的搜索引擎)根据查询的含义而不是准确的关键词来检索文章或论文。了解有关语义搜索的更多信息
  • 聊天机器人利用矢量搜索提供与上下文相关的答案,从而提高用户满意度。

异常检测

在网络安全和金融等行业,矢量搜索可用于检测异常值或异常现象:

  • 网络入侵检测系统分析网络活动的矢量表示,以识别异常模式。
  • 银行业务中的欺诈检测系统使用向量搜索来比较交易向量,标记出明显偏离正常行为的交易向量。探索异常检测

技术信息

要进行大规模的矢量搜索,通常需要使用专门的工具和框架。MilvusPinecone等矢量数据库旨在高效处理大规模、高维矢量数据。这些系统利用近似近邻(ANN)算法来加速搜索性能,因此适合实时应用。

此外,利用主成分分析(PCA)等技术进行降维等预处理步骤,可以在保留有意义的关系的同时缩小矢量数据的大小,从而优化矢量数据的存储和检索。

与相关概念的区别

  • 语义搜索:矢量搜索是语义搜索的基础,而语义搜索则专门侧重于根据查询的上下文含义检索结果,通常在 NLP 应用中使用。进一步了解语义搜索
  • 矢量数据库:这是一种专门的存储系统,针对矢量数据的管理和查询进行了优化,可以大规模地进行矢量搜索。了解矢量数据库

真实世界的例子:自动驾驶汽车

自动驾驶汽车依靠矢量搜索来实时处理和分析周围环境。例如

真实世界的例子:人工智能助力招聘

在人才招聘中,矢量搜索用于将候选人与职位描述相匹配:

  • 人工智能系统可将简历和招聘信息转化为矢量嵌入,使招聘人员能够识别出技能和经验与职位要求密切相关的应聘者。

结论

矢量搜索是一项变革性技术,它使人工智能系统能够在各种数据类型(从文本和图像到音频和视频)中执行基于相似性的检索。通过利用先进的嵌入和相似性度量,矢量搜索促进了从个性化推荐到异常检测等各种应用。探索Ultralytics HUB 等工具,将视觉人工智能功能无缝集成到您的项目中。

阅读全部