深入了解RNN、LSTM和GRU的概念、异同和优缺点

　　发布于2024-11-14　阅读（0）

扫一扫，手机访问

一文了解RNN、LSTM和GRU的概念、异同和优缺点

在时间序列数据中，观察之间存在依赖关系，因此它们不是相互独立的。然而，传统的神经网络将每个观察看作是独立的，这限制了模型对时间序列数据的建模能力。为了解决这个问题，循环神经网络(RNN)被引入，它引入了记忆的概念，通过在网络中建立数据点之间的依赖关系来捕捉时间序列数据的动态特性。通过循环连接，RNN可以将之前的信息传递到当前观察中，从而更好地预测未来的值。这使得RNN成为处理时间序列数据任务的强大工具。

但是RNN是如何实现这种记忆的呢？

RNN通过神经网络中的反馈回路实现记忆，这是RNN与传统神经网络的主要区别。反馈回路允许信息在层内传递，而前馈神经网络的信息仅在层之间传递。因此，有了不同类型的RNN：

循环神经网络(RNN)
长短期记忆网络(LSTM)
门控循环单元网络(GRU)

本文将介绍RNN、LSTM和GRU的概念和异同点，以及它们的一些优点和缺点。

循环神经网络(RNN)

通过反馈回路，一个RNN单元的输出也被同一单元用作输入。因此，每个RNN都有两个输入：过去和现在。使用过去的信息会产生短期记忆。

为了更好地理解，可以展开RNN单元的反馈循环。展开单元格的长度等于输入序列的时间步数。

可以看到过去的观察结果是如何作为隐藏状态通过展开的网络传递的。在每个单元格中，当前时间步的输入、前一时间步的隐藏状态和偏置组合，然后通过激活函数限制以确定当前时间的隐藏状态步。

RNN可用于一对一、一对多、多对一和多对多预测。

RNN的优点

由于其短期记忆，RNN可以处理顺序数据并识别历史数据中的模式。此外，RNN能够处理不同长度的输入。

RNN的缺点

RNN存在梯度下降消失的问题。在这种情况下，用于在反向传播期间更新权重的梯度变得非常小。将权重与接近于零的梯度相乘会阻止网络学习新的权重。停止学习会导致RNN忘记在较长序列中看到的内容。梯度下降消失的问题随着网络层数的增加而增加。

由于RNN仅保留最近的信息，所以该模型在考虑过去的观察时会出现问题。因此，RNN只有短期记忆而没有长期记忆。

此外，由于RNN使用反向传播及时更新权重，网络也会遭受梯度爆炸的影响，如果使用ReLu激活函数，则会受到死亡ReLu单元的影响。前者可能会导致收敛问题，而后者会导致停止学习。

长短期记忆(LSTM)

LSTM是一种特殊类型的RNN，它解决了RNN会梯度消失的问题。

LSTM的关键是单元状态，它从单元的输入传递到输出。单元状态允许信息沿着整个链流动，仅通过三个门进行较小的线性动作。因此，单元状态代表LSTM的长期记忆。这三个门分别称为遗忘门、输入门和输出门。这些门用作过滤器并控制信息流并确定保留或忽略哪些信息。

遗忘门决定了应该保留多少长期记忆。为此，使用了一个sigmoid函数来说明单元状态的重要性。输出在0和1之间变化，0即不保留任何信息；1则保留单元状态的所有信息。

输入门决定将哪些信息添加到单元状态，从而添加到长期记忆中。

输出门决定单元状态的哪些部分构建输出。因此，输出门负责短期记忆。

总的来说，状态通过遗忘门和输入门更新。

LSTM的优点

LSTM的优点类似于RNN，主要优点是它们可以捕获序列的长期和短期模式。因此，它们是最常用的RNN。

LSTM的缺点

由于结构更复杂，LSTM的计算成本更高，从而导致训练时间更长。

由于LSTM还使用时间反向传播算法来更新权重，因此LSTM存在反向传播的缺点，如死亡ReLu单元、梯度爆炸等。

门控循环单元(GRU)

与LSTM类似，GRU解决了简单RNN的梯度消失问题。然而，与LSTM的不同之处在于GRU使用较少的门并且没有单独的内部存储器，即单元状态。因此，GRU完全依赖隐藏状态作为记忆，从而导致更简单的架构。

重置门负责短期记忆，因为它决定保留和忽略多少过去的信息。

更新门负责长期记忆，可与LSTM的遗忘门相媲美。

当前时间步的隐藏状态是基于两个步骤确定的：

首先，确定候选隐藏状态。候选状态是当前输入和前一时间步的隐藏状态以及激活函数的组合。前一个隐藏状态对候选隐藏状态的影响由重置门控制。

第二步，将候选隐藏状态与上一时间步的隐藏状态相结合，生成当前隐藏状态。先前的隐藏状态和候选隐藏状态如何组合由更新门决定。

如果更新门给出的值为0，则完全忽略先前的隐藏状态，当前隐藏状态等于候选隐藏状态。如果更新门给出的值为1，则相反。

GRU的优势

由于与LSTM相比有着更简单的架构，GRU的计算效率更高，训练速度更快，只需要更少的内存。

此外，GRU已被证明对于较小的序列更有效。

GRU的缺点

由于GRU没有单独的隐藏状态和细胞状态，因此它们可能无法像LSTM那样考虑过去的观察结果。

与RNN和LSTM类似，GRU也可能遭受反向传播及时更新权重的缺点，即死亡ReLu单元、梯度爆炸。

本文转载于：https://fuxi.163.com/database/474 如有侵犯，请联系admin@zhengruan.com删除

上一篇：使用Scrapy定制化爬虫来生成抓取和分析报告

下一篇：揭秘iOS 17天气应用亮点：回顾昨日天气并预测未来10天下雨概率

产品推荐

售后无忧
立即购买>

DAEMON Tools Lite 10【序列号终身授权 + 中文版 + Win】

￥150.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Ultra 5【序列号终身授权 + 中文版 + Win】

￥198.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Pro 8【序列号终身授权 + 中文版 + Win】

￥189.00
office旗舰店
售后无忧
立即购买>

CorelDRAW X8 简体中文【标准版 + Win】

￥1788.00
office旗舰店

正版软件

Linux发行版对于AMD Ryzen Zen 2处理器提供了持续的支持，并对L3缓存进行了优化以提升性能

6月3日消息，根据国外科技媒体NeoWin的报道，Linux发行版并不计划效仿Windows11，相反，他们将继续为基于AMDRyzenZen2处理器的用户提供支持，并通过对L3缓存(LLC)的优化来进一步提升性能。近日发布的select_idle_sibling()补丁为Linux内核带来了一些改进。该补丁允许操作系统将任务分配给被标记为“闲置”状态的处理器线程，不仅限于识别本地L3缓存中的闲置线程。这一变化在AMDZen2设备上特别重要，因为在处理特定LLC的工作队列时，通常会出现核心闲置的情况。据小

12分钟前 Linux 0
正版软件

微软开启macOS和iOS平台测试，全新的自动裁剪功能即将推出！

7月1日消息，微软今天发布博文，邀请Microsoft365Insider项目成员参与测试新功能和特性。据悉，此次测试将针对macOS、iOS和安卓平台应用进行，涵盖了自动裁剪和合并PDF文件两个重要功能。据小编了解，微软在此次测试中特别邀请了macOS和iOS平台的Microsoft365Insider项目成员，让他们在Word、PowerPoint和Excel应用程序中体验自动裁剪功能。这项新功能能够自动识别图片中最重要的部分并裁剪其余部分，取代了以往繁琐的手动裁剪操作。用户只需简单点击，即可快速完成

17分钟前微软 0
正版软件

佳明Lily 2智能手表支持页面意外曝光，日本市场即将上市细节揭秘

佳明(Garmin)宣布即将推出新一代智能手表Lily2，引起了广泛关注。据悉，这款新品有望在近期正式上市。近日，佳明日本的支持页面意外曝光了Lily2Sport的清晰照片。从照片中可以看出，Lily2继续沿用了初代的设计风格，采用光面表圈与磨砂表身的搭配，展现出独特的美感。同时，这款手表也是专为女性用户打造的，相信会受到不少消费者的喜爱。根据我们的了解，除了Lily2Sport之外，泄露的图片还展示了四款Lily2Classic的不同款式。这些款式还提供了皮革和尼龙材质的表带选择，以满足消费者的不同需求

32分钟前佳明 0
正版软件

苹果macOS用户即将享受全新功能：畅玩Windows游戏

6月7日消息，苹果在今天举办的WWDC2023开发者大会上揭示了一项令人振奋的计划，他们将在macOS系统中推出一种新的功能，允许用户模拟运行Windows10和Windows11系统的游戏。这一消息对于广大游戏玩家来说无疑是个令人兴奋的消息。据小编了解，在此次活动中，苹果详细介绍了如何通过引入metalShaderConverter和metal调试工具来提升游戏性能，并显著减少前期准备所需的时间。这意味着用户可以更轻松地在macOS平台上畅玩Windows游戏，无需单独购买Windows设备。值得一提的

47分钟前苹果 0
正版软件

三星S24系列即将推出AI功能！？发布会前的最后爆料，这次的惊喜可靠！

三星S24系列要上AI！？发布会前最后一爆，这波稳了！今年三星还是期待值点满的，根据爆料来看，今年三星S24系列会着重在AI方面发力，不知道会带来什么样的惊喜，无独有偶，前阵子OPPO也发布了最新的AI手机：FindX7系列，这还是首个端侧搭载70亿大数据模型的手机，目前各路测评博主都是一致好评。看了迪仔Dizzz的FindX7测评，感觉OPPO这波是整了个好玩又好用的AI功能，就比如这个通话摘要功能，就能对通话内容进行重点摘要，像是需要记事的时候十分方便，对于文章也能使用摘要功能，并且还可以直接翻译成中

1小时前 04:40 AI 三星S24系列 0