加入收藏 | 设为首页 | 会员中心 | 我要投稿 衡阳站长网 (https://www.0734zz.cn/)- 数据集成、设备管理、备份、数据加密、智能搜索!
当前位置: 首页 > 站长资讯 > 动态 > 正文

详解:递归神经网络和LSTM网络那些事儿

发布时间:2018-04-15 18:12:58 所属栏目:动态 来源:李佳惠
导读:【编译】递归神经网络是最先进的顺序数据算法之一,在苹果Siri和Google语音搜索中都使用到的算法。这是因为它是第一个记忆它的输入的算法,由于内部存储器,这使得它非常适合涉及顺序数据的机器学习问题。它是过去几年Deep Learning的惊人成就背后的算法之

  下图展示了一个展开的RNN。在左侧,你可以看到等号后展开的RNN。请注意,等号后面没有循环,因为不同的时间步可视化,信息从一个时间步传递到下一个时间步。这个例子也说明了为什么RNN可以被看作是神经网络的一个序列。  详解:递归神经网络和LSTM网络那些事儿

  如果随时间反向传播,则需要进行展开的概念化,因为给定时间步的误差取决于先前的时间步。

  在BPTT中,错误从最后一步反向传播到第一步,同时展开所有时间步。这允许计算每个时间步的误差,允许更新权重。请注意,当拥有大量时间步时,BPTT可能在计算上很昂贵。

  标准RNN的两个问题

  RNN存在或不得不处理两大障碍。但要理解它们,你首先需要知道什么是渐变。

  梯度是相对于其输入的偏导数。如果你不知道这意味着什么,只要想一想就可以了:如果你稍微改变一下输入,梯度就会测量一个函数输出的变化。

  你也可以将梯度看作函数的斜率。坡度越高,坡度越陡,模型可以学习得越快。但如果斜率为零,模型停止学习。梯度简单地衡量所有权重的变化与错误的变化有关。

  梯度爆炸

  当算法赋予权重非常重要时,我们会谈到“梯度爆炸”,没有太多理由。但幸运的是,如果你截断或挤压渐变,则可以轻松解决此问题。

  消失的梯度

(编辑:衡阳站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读