当前位置: 首页 > news >正文

长短期记忆网络LSTM

视频链接

1.LSTM与RNN的区别

RNN想把所有信息都记住,不管是有用的信息还是没用的信息,并且有梯度爆炸或者梯度消失的问题
而LSTM设计了一个记忆细胞,具备选择记忆功能,可以选择记忆重要信息,过滤掉噪声信息,减轻记忆负担。

2. 前向传播的过程

2.1对比RNN

在这里插入图片描述

2.2 单元结构

符号解释:
C t − 1 C_{t-1} Ct1表示t-1时刻的记忆细胞
h t − 1 h_{t-1} ht1表示t-1时刻的隐藏层状态
s i g m o i d sigmoid sigmoid门单元
f t f_t ft遗忘门
i t i_t it更新门
o t o_t ot输出门

在LSTM的每个时间步里面,都有一个记忆cell,这个东西给予了LSTM选择记忆功能,使得LSTM有能力自由选择每个时间步里面记忆的内容

在这里插入图片描述

2.3 结合例子理解LSTM单元结构

场景:期末考试周(高数→线性代数)
输入 X t X_t Xt:线性代数
输出 h t h_t ht:高分
遗忘门:遗忘高数积累的记忆 C t − 1 C_{t-1} Ct1
更新门:选择性的提取有用的线性代数知识,然后结合高数保留下来的数学运算能力
输出门:把没考的知识丢掉
t a n h tanh tanh:把记忆的知识 C t C_t Ct转为答题解题的能力

在这里插入图片描述

4. LSTM如何缓解梯度消失

4.1 RNN梯度消失回顾

在这里插入图片描述

4.2LSTM反向传播

假设: t = 3 t=3 t=3,即从左到右的输出分别是 y 1 y_1 y1 y 2 y_2 y2 y 3 y_3 y3

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

http://www.lryc.cn/news/526598.html

相关文章:

  • 2. 握手问题python解法——2024年省赛蓝桥杯真题
  • poi在word中打开本地文件
  • 国产编辑器EverEdit - 输出窗口
  • 整数的个数(信息学奥赛一本通-1067)
  • ios swift画中画技术尝试
  • MyBatis 写法
  • Three城市引擎地图插件Geo-3d
  • 【贪心算法】洛谷P1106 - 删数问题
  • WPS计算机二级•幻灯片的页面布局
  • 从入门到精通:HttpClient深度剖析与实战指南
  • IoTDB 2025 春节值班与祝福
  • Java 大视界 -- Java 大数据中的隐私增强技术全景解析(64)
  • 【2024年华为OD机试】 (A卷,100分)- 整理扑克牌(JavaScriptJava PythonC/C++)
  • 周末总结(2024/01/25)
  • Apache Flink 概述学习笔记
  • 双足机器人开源项目
  • Linux 部署 Java 项目:Tomcat、Redis、MySQL 教程
  • Django 多环境配置实战指南
  • 【C++高并发服务器WebServer】-6:信号
  • HBase的原理
  • [b01lers2020]Life on Mars1
  • Go学习:常量
  • Python 爬虫——爬取Web页面图片
  • 微信小程序1.1 微信小程序介绍
  • 记录备战第十六届蓝桥杯的过程
  • AI 编程工具—Cursor进阶使用 Rules for AI
  • 以租赁合同的例子讲清楚 开源协议原理和区别
  • mysql如何修改密码
  • 解数独力扣
  • Zookeeper(28)Zookeeper的线性化写入和顺序一致性读是什么?