词汇表

嵌入

探索嵌入技术如何连接人类数据与机器逻辑。学习使用Ultralytics 生成AI任务的向量表示，并深入探索Ultralytics 。

嵌入是离散变量的密集、低维、连续向量表示，充当人类数据与机器逻辑之间的基础转换器。在人工智能领域，计算机无法直观理解文本、图像或音频等杂乱无章的非结构化数据。嵌入技术通过将这些输入转换为实数列表（即存在于高维数学空间中的向量）来解决此问题。与传统编码仅为对象分配随机ID不同，嵌入技术通过训练实现学习，确保语义相似的元素——如"国王"与"女王"等词汇，或两只不同猫的图像——在向量空间中紧密邻接。

嵌入式如何工作

嵌入的创建过程涉及将原始数据输入到专门用于特征提取的神经网络中。在训练期间，模型学会将输入数据的核心特征压缩为紧凑的数值形式。例如，分析照片的计算机视觉（CV）模型不仅识别像素，还会将形状、纹理和颜色映射到多维图中的特定坐标。在相似性测算中，系统通过余弦相似度或欧几里得距离等度量标准计算坐标间距离。这种数学上的邻近性使算法能够高效执行分类、聚类等复杂任务。

实际应用

嵌入技术作为现代软件产品中众多智能功能的核心引擎。

语义搜索传统搜索引擎通常依赖精确关键词匹配，当用户查询"auto"而文档包含"car"时就会失效。嵌入技术能捕捉词语背后的语义。通过将搜索查询和数据库文档表示为向量，系统即使遇到词汇差异也能检索出符合用户意图的结果。
推荐系统流媒体服务和电商网站利用嵌入技术实现用户体验个性化。当用户观看一部科幻电影时，系统会识别该影片的嵌入向量，并在数据库中搜索具有相似向量的其他影片。这使得推荐系统能够基于内容相似性进行精准推荐，而非仅依赖人工标签或分类。
零样本学习：先进模型通过联合嵌入技术将不同模态（如文本与图像）进行关联。这使得系统能够通过将图像嵌入与物体名称的文本嵌入建立关联，从而识别训练过程中从未明确见过的物体。

使用Python生成嵌入向量

诸如...之类的尖端模型 YOLO26 可用于高效生成鲁棒图像嵌入。以下示例演示了如何使用从图像中提取特征向量。 ultralytics Python 软件包。

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Generate embeddings for an image
# The embed() method returns the feature vector representing the image content
embedding_vector = model.embed("https://ultralytics.com/images/bus.jpg")

# Print the shape of the embedding (e.g., a vector of length 1280)
print(f"Embedding shape: {embedding_vector[0].shape}")

嵌入与相关概念

要有效实施人工智能解决方案，区分嵌入与相关技术术语很有帮助。

嵌入与向量搜索：嵌入本身即为数据表示形式（即数值列表）。向量搜索则是后续通过查询数据库来寻找该嵌入最近邻的过程。通常采用称为向量数据库的专用工具来大规模存储和检索这些嵌入。
嵌入与分词： 在自然语言处理（NLP）中，分词是将文本拆解为更小单元（词元）的初步步骤。这些词元随后会被映射到嵌入向量。因此，分词负责数据准备，而嵌入则承载数据的语义信息。
嵌入与深度学习：深度学习是基于神经网络的更广泛机器学习领域。嵌入是深度学习架构中的特定输出层或中间层，通常充当原始输入与模型决策层之间的桥梁。

开发者若需管理数据集的生命周期——包括为生成定制嵌入向量而进行的标注和模型训练——可Ultralytics 。这一综合性工具简化了从数据管理到部署的整个工作流程，确保应用程序所依赖的嵌入向量源自高质量、精心整理的数据。无论使用PyTorch等框架 PyTorch 或 TensorFlow，掌握嵌入技术都是构建复杂模式识别系统的重要环节。

嵌入

培训Ultralytics YOLO 模型，以简化各行业的工作流程

灵活的企业许可解决方案，助力您的创新

使用Ultralytics YOLO在数秒内训练人工智能模型

嵌入式如何工作

实际应用

使用Python生成嵌入向量

嵌入与相关概念

阅读更多此类别的内容

12个基于计算机视觉的航拍影像应用场景

什么是单目深度估计？概述

Ultralytics YOLO 进行人工智能威胁检测

加入Ultralytics 社区