术语表

自动编码器

了解自动编码器如何利用先进的人工智能技术压缩数据、降低噪音并实现异常检测、特征提取等功能。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

自动编码器是一种人工神经网络(NN),主要用于无监督学习任务。它的主要目标是通过训练网络重构自己的输入,学习输入数据的高效表示(编码),通常用于降维特征提取。它通过将输入压缩到低维潜在空间,然后根据压缩后的表示重建输出来实现这一目标。

自动编码器的工作原理

自动编码器由两个主要部分组成:编码器和解码器。

  1. 编码器:这部分接收输入数据,并将其映射到称为潜空间或瓶颈的低维表示。编码器学会捕捉数据中最重要的特征,同时丢弃噪音或冗余信息。这一过程类似于数据压缩。
  2. 解码器:这部分从潜空间获取编码表示,并尝试尽可能准确地重建原始输入数据。

网络通过最小化原始输入和重构输出之间的差异来进行训练,通常用平均平方误差 (MSE) 等损失函数来衡量。瓶颈层迫使网络学习紧凑而有意义的表示,因为它必须保留足够的信息才能有效地重建输入。

自动编码器的类型

自动编码器有几种变体,每种都是为特定目的而设计的:

  • 去噪自动编码器:经过训练,可从损坏或噪声版本中重建干净的原始输入。这使得它们在降噪任务中非常有用。
  • 稀疏自动编码器:在训练过程中引入稀疏性约束,鼓励网络学习在任何时候都只有少数节点处于活动状态的表征。
  • 变异自动编码器(VAE):一种生成模型,可学习潜空间的概率分布,从而生成与训练数据类似的新数据样本。VAE 与另一种流行的生成技术生成对抗网络 (GAN) 有很大不同。
  • 收缩自动编码器:旨在学习对输入数据的微小变化具有鲁棒性的表征。

实际应用

自动编码器在各个领域都有应用:

  • 异常检测:通过学习数据中的正常模式,自动编码器可以识别异常或异常值输入,这些输入会导致较高的重构误差。这可用于欺诈检测和工业质量控制。例如,检测可能预示着网络攻击的异常网络流量模式。
  • 图像去噪和压缩去噪自动编码器可以清除嘈杂的图像,而标准自动编码器则可以通过只存储潜在表示来压缩图像。例如,恢复受大气干扰影响的老照片或卫星图像的清晰度。了解计算机视觉如何用于分析卫星图像
  • 降维:学习到的潜在表征可以作为输入其他机器学习(ML)模型的紧凑特征,从而提高性能并降低计算成本。尽管自动编码器可以捕捉到更复杂的非线性关系,但它通常可与主成分分析(PCA)等技术相媲美。
  • 数据生成(VAE):变异自动编码器可以生成新的合成数据样本,在艺术生成或创建训练数据增强等领域非常有用。进一步探索合成数据

工具和实施

自动编码器通常使用深度学习框架来实现,例如 PyTorchTensorFlow.架构通常涉及用于图像数据的卷积神经网络(CNN)或用于序列数据的递归神经网络(RNN)。可以使用Ultralytics HUB等平台或实验跟踪工具管理和跟踪这些模型的训练,例如 Weights & BiasesMLflow 等实验跟踪工具来管理和跟踪这些模型的训练。有关模型训练的更多详情,请查阅Ultralytics 文档

阅读全部