术语表

嵌入

了解什么是嵌入,以及嵌入如何通过捕捉数据中的语义关系为 NLP、推荐和计算机视觉提供人工智能支持。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

在机器学习和人工智能领域,嵌入是一种将数据(单词、句子甚至图像)表示为多维空间中的点的方法,每个点的位置反映了其语义或特征。分析大量数据的算法可以学习这些表示法,从而捕捉复杂的关系和模式。嵌入是让机器更有效地理解和处理自然语言及其他形式数据的基础。

什么是嵌入?

嵌入本质上是数据的密集向量表示。传统方法可能会将单词或项目表示为独特、独立的符号,而嵌入则不同,它通过将数据点映射到高维空间中的实数向量来捕捉意义的细微差别。这个空间通常被称为嵌入空间。其关键在于,相似的项目会有相似的嵌入,这意味着它们在这个空间中的位置会相互靠近。例如,在单词嵌入模型中,具有相似含义的单词,如 "猫 "和 "小猫",将由相邻的向量来表示。

嵌入式如何工作

嵌入通常使用在大型数据集上训练的神经网络模型生成。例如,可以训练一个模型,根据句子中的周边词来预测一个词。在这个训练过程中,模型会学习如何将每个词映射到一个向量上,以捕捉其语义上下文。嵌入空间的维度是模型的一个超参数,通常从几十到几百不等。每个维度都能捕捉数据意义或特征的不同方面,尽管这些方面并不总是能被人类直接解读。

嵌入的应用

嵌入式技术在人工智能和机器学习的各个领域都有广泛的应用。下面是几个著名的例子:

自然语言处理(NLP)

在 NLP 中,词嵌入被用于情感分析、机器翻译和文本分类等应用。通过将单词表示为向量,模型可以执行数学运算来理解和生成文本。例如,著名的等式 "国王-男人+女人=王后 "经常使用词嵌入来说明这些向量如何捕捉语义关系。

推荐系统

嵌入在推荐系统中用来表示用户和项目。通过将用户和项目映射到相同的嵌入空间,系统可以推荐接近用户偏好的项目。Netflix 和亚马逊等公司采用这种方法,根据用户行为和物品特征推荐电影或产品。

计算机视觉

嵌入式虽然在 NLP 中不太常见,但也可用于计算机视觉。例如,可以将图像映射到一个嵌入空间,在这个空间中,相似的图像被定位在一起。这可用于图像检索或聚类等任务。利用Ultralytics YOLO 模型,用户可以通过整合对象检测图像分割功能来进一步增强图像分析,从而使嵌入信息更加丰富,对特定应用更加有用。

与嵌入相关的关键概念

矢量空间模型

向量空间模型是一种数学模型,用于将文本文档或任何对象表示为标识符向量。它是嵌入的基本概念,向量的每个维度对应一个单独的术语或特征。

降维

主成分分析(PCA)t 分布随机邻域嵌入(t-SNE)等技术通常用于在低维空间(如二维或三维)中可视化高维嵌入,同时保留点之间的相对距离。降维有助于理解和解释嵌入空间。

上下文嵌入

传统的词嵌入(如 Word2Vec 和 GloVe)为每个词提供静态表示。相比之下,语境嵌入(如BERT(来自变换器的双向编码器表示法)和其他变换器模型生成的嵌入)会根据单词出现的语境而变化。这样,模型就能捕捉一个词在不同句子中的不同含义。

嵌入与其他表示技术的比较

单热编码

一热编码是表示分类数据的一种简单方法,其中每个类别都表示为二进制向量,其中只有一个 "1",其余均为 "0"。与嵌入不同,一元向量是稀疏的,不能捕捉类别之间的语义关系。

词袋(BoW)

词袋模型将文本表示为每个词的频率,而不考虑语法和词序。虽然简单,但它不能像嵌入模型那样捕捉单词的语义。

TF-国际开发基金

TF-IDF(词频-反向文档频率)是一种数字统计量,它反映了一个词在文档集或语料库中的重要程度。它将单词在文档中的出现频率与单词在整个语料库中的罕见程度相结合,提供了一种相关性度量。TF-IDF 虽然有用,但它不能像嵌入式那样有效地捕捉语义关系。

结论

嵌入已成为现代机器学习的基石,尤其是在 NLP 领域。通过将数据表示为多维空间中的密集向量,嵌入式技术可以捕捉丰富的语义关系,实现更复杂的处理和分析。无论是理解自然语言、为推荐系统提供动力,还是增强计算机视觉任务,嵌入技术在提升人工智能系统的能力方面都发挥着至关重要的作用。随着研究的不断深入,我们可以期待嵌入式技术继续发展,从而带来更强大、更细致的数据表示。有了Ultralytics HUB 这样的工具,管理和部署这些高级模型变得更加容易,用户可以高效地训练YOLO 模型,并将尖端的人工智能解决方案集成到他们的应用中。

阅读全部