术语表

递归神经网络（RNN）

从 NLP 到时间序列分析，探索循环神经网络 (RNN) 在序列数据方面的强大功能。立即了解关键概念和应用！

递归神经网络（RNN）是一种专门用于处理序列数据的神经网络（NN），其中信息的顺序至关重要。与独立处理输入的标准前馈网络不同，RNN 具有内部存储器（通常称为隐藏状态），可保留序列中先前输入的信息。这种 "记忆 "是通过循环机制实现的，其中一个步骤的输出作为输入反馈到下一个步骤，使网络能够建立上下文并理解随时间变化的依赖关系。这使得它们在处理涉及文本、语音或时间序列数据等序列的任务时非常有效。

RNN 如何工作？

RNN 的核心理念是其递归性。在处理一个序列（如句子中的单词）时，网络接收第一个项目，进行计算，然后产生输出。在处理第二个项目时，它会同时考虑新的输入和从第一个项目中学到的信息。这一过程被称为 "时间反向传播"（BPTT），它将持续整个序列，使模型建立起对上下文的理解。这种结构是许多自然语言处理（NLP）和时间序列分析任务的基础。

实际应用

RNN 在人工智能（AI）的多个领域都具有奠基性作用。

自然语言处理 (NLP)：RNN 擅长理解人类语言的结构。它们可用于
- 机器翻译： 谷歌翻译等服务历来使用基于 RNN 的模型，通过按顺序处理单词来翻译文本，以保留含义和语法。
- 情感分析：RNN 可以分析一段文本（如产品评论），通过理解词序提供的上下文来确定情感是积极的、消极的还是中性的。
- 语音识别：虚拟助手使用 RNNs 将音频信号处理为随时间变化的序列，从而将口头语言转换为文本。
时间序列预测：RNN 非常适合根据历史数据进行预测。
- 金融预测：它们可用于分析股票市场数据，预测未来的价格走势，尽管这仍然是一项非常复杂的挑战。
- 天气预测：通过分析历史天气模式的时间序列，RNN 可以帮助预测未来的天气状况。美国国家大气研究中心等机构正在进一步开展这方面的研究。

挑战与现代选择

尽管简单 RNN 有其优势，但它们也面临着一个重大挑战，即梯度消失问题。这使得它们难以学习序列中相距甚远的元素之间的依赖关系。为了解决这个问题，人们开发了更先进的架构。

长短期记忆（LSTM）：一种特殊的 RNN，具有更复杂的内部结构，包括控制记忆或遗忘信息的 "门"。这使它们能够有效地学习长距离依赖关系。克里斯托弗-奥拉（Christopher Olah）的博文对 LSTM 做了很好的解释。
门控循环单元（GRU）：LSTM 的简化版，结合了某些门电路。GRU 的计算效率更高，在许多任务中的表现也不相上下，因此成为一种流行的替代方案。
变压器：这种架构在论文"Attention Is All You Need"中介绍过，在最先进的 NLP 模型中，它在很大程度上取代了 RNN。它使用注意力机制来同时处理序列中的所有元素，而不是递归，从而能更有效地捕捉长程依赖关系，并在训练过程中实现更高的并行化。
卷积神经网络（CNN）：RNN 专为序列数据而设计，而 CNN 则专为网格状数据（如图像）而构建。它们擅长检测空间层次，是计算机视觉（CV）任务的基础。Ultralytics YOLO等模型使用基于 CNN 的架构进行物体检测和图像分割。

PyTorch和TensorFlow 等深度学习框架提供了 RNN 及其变体的预建模块，使构建这些模型变得容易。您可以使用Ultralytics HUB 等平台管理从训练到部署的整个模型生命周期。

递归神经网络（RNN）

灵活的企业许可解决方案为您的创新提供动力

使用 Ultralytics YOLO 在数秒内训练人工智能模型

使用 Ultralytics HUB 简单训练 YOLO 模型

RNN 如何工作？

实际应用

挑战与现代选择

在此类别中阅读更多内容

了解快速成型制造：技术和使用案例

使用 Ultralytics YOLO 监测机场地面运行11

机器人技术在制造业中的发展与未来

加入 Ultralytics 社区