当前位置: 首页 > news >正文

57 长短期记忆网络(LSTM)【动手学深度学习v2】

57 长短期记忆网络(LSTM)【动手学深度学习v2】

深度学习学习笔记
学习视频:https://www.bilibili.com/video/BV1JU4y1H7PC/?spm_id_from=autoNext&vd_source=75dce036dc8244310435eaf03de4e330

长短期记忆网络(LSTM)
LSTM 实际中比较常用的网络,LSTM比GRU复杂一些。
忘记门、输入门、输出门,效果上也是是不是要忘记过去的状态尽量去看现在的输入数据;还是说不看现在的状态尽量去用前一个时刻的状态。
在这里插入图片描述
三个门,计算差不多,XW + Ht-1W + b。
在这里插入图片描述

候选记忆单元
C : 之前算RNN里面那个H相似。
在这里插入图片描述
记忆单元
上一个时刻的记忆单元会当做状态传进来,F 尽量不去记住前一个状态 Ct-1,I 尽量去用Ct。
在这里插入图片描述
隐藏状态
对候选记忆单元Ct再做一个tanh。
记忆单元处的计算公式,可能将Ct变化为(-2,2),Ht需要在(-1,1)所以需要再做一次tanh,Ot是控制要不要输出(1 输出 ,0 重置不要所有的信息)。
在这里插入图片描述

总结:LSTM 和GRU实现效果差不多,但是更加复杂,多了一个C(没有被normalize,所以区间可能会大,忘掉前面的Ct-1,只用当前的Ct),Ht一样可要之前又可不要之前。
在这里插入图片描述

http://www.lryc.cn/news/2071.html

相关文章:

  • 算法第十五期——动态规划(DP)之各种背包问题
  • 实现复选框全选和全不选的切换
  • React hooks之useState用法(一)
  • spring的简单理解
  • Docker调用Intel集显实现FFmpeg硬解码
  • 端到端模型(end-to-end)与非端到端模型
  • uniApp封装一个滑块组件
  • 运动基元(二):贝塞尔曲线
  • Android 11.0 关于Launcher3中调用截图功能总是返回null的解决方案
  • random随机数
  • 【金三银四系列】Spring面试题-上(2023版)
  • linux基本功系列之tar命令实战
  • Prometheus服务发现
  • 【Spring6源码・MVC】请求处理流程源码解析
  • elasticsearch term match 查询
  • canal使用说明:MySQL、Redis实时数据同步
  • 计算机视觉框架OpenMMLab开源学习(三):图像分类实战
  • awk命令
  • LocalDateTime获取时间的年、月、日、时、分、秒、纳秒
  • MoveIT Rviz和Gazebo联合仿真
  • ESP32S2(12K)-DS18B20数码管显示温度
  • linux栈溢出定位
  • CSS基础:选择器和声明样式
  • VS中安装gismo库
  • 元学习方法解决CDFSL以及两篇SOTA论文讲解
  • 大数据之------------数据中台
  • Python 中 字符串是什么?
  • OJ刷题Day1 · 一维数组的动态和 · 将数字变成 0 的操作次数 · 最富有的客户资产总量 · Fizz Buzz · 链表的中间结点 · 赎金信
  • 【数据结构】栈——必做题
  • LearnOpenGL 笔记 - 入门 04 你好,三角形