当前位置: 首页 > news >正文

Rethink LSTMGRU

LSTM 设计思想

在这里插入图片描述
姑且不看偏置。 W W W U U U 是加权的矩阵,写模型的时候用 nn.Linear(in_dim, out_dim) 就成; σ \sigma σ 是 Sigmoid 函数

  • 第一条,遗忘门,定义为 有多少内容需要被遗忘;
  • 第二条:输入门,定义为 有多少输入值有多少能进入到 RNN 模型里;
  • 第三条:输出门,定义为 有多少内容能够成为输出值

这三个 0 到 1 的值,是聚合当前的输入特征 x t x_t xt 和 上一时刻的隐藏状态 h t − 1 h_{t-1} ht1 所计算得到的。它们表示的意思是,聚合当前的输入信息以及记忆信息(之前的信息),来决定模型不同的位置有多少比例保留下来。

  • 第四条:表示 “当前信息”,使用 tanh 映射到 -1到 1之间;
  • 第五条:表示 “当前的记忆信息”,根据上一时刻的信息有多少被遗忘以及当前输入有多少能进入所聚合得到;
  • 第六条:表示 隐藏状态,由当前的记忆信息的一定比例计算得到

从这六条式子中,一定要知道,LSTM 接收 3 个输入值分别为 x t x_t xt h t − 1 h_{t-1} ht1 c t − 1 c_{t-1} ct1
根据 LSTM 由三个输入,可以设计一个 Gate Fusion Module,输入三个 Tensor 聚合得到一个 Tensor,用 tensor. Repeat(x,y,z) 来对其维度。这样做可以简单聚合不同模态的信息

GRU

在这里插入图片描述
理解起来和前者的叙述类似

最终要的地方是,可以作为 Gate Fusion,所设计的 Gate Fusion 以两个 tensor 作为输入,就用 GRU 这一套计算公式,如果以三个 tensor 作为输入,就用 LSTM 这一套公式,剩下的对齐维度跑通 forward 函数就行

http://www.lryc.cn/news/162775.html

相关文章:

  • 状态管理艺术——借助Spring StateMachine驭服复杂应用逻辑
  • 获取和设置小程序和h5的页面栈
  • Mysql基于成本选择索引
  • Element-ui container常见布局
  • ssm实现折线统计图
  • GLSL ES着色器 精度限定字
  • webrtc的FULL ICE和Lite ICE
  • flink的几种常见的执行模式
  • 蓝桥杯备赛Day8——队列
  • 用滑动条做调色板---cv2.getTrackbarPos(),cv2.creatTrackbar()
  • dubbo 服务注册使用了内网IP,而服务调用需要使用公网IP进行调用
  • 外传-Midjourney的局部重绘功能
  • Spring Boot 中使用 Poi-tl 渲染数据并生成 Word 文档
  • Java基础(二十一)十点半游戏
  • 第8节-PhotoShop基础课程-常用快捷键汇总
  • Redis带你深入学习数据类型set
  • Json“牵手”易贝商品详情数据方法,易贝商品详情API接口,易贝API申请指南
  • 《AI一键生成抖音商品种草文案》让你秒变带货王!
  • 博客系统(升级(Spring))(二)获取当前用户信息、对密码进行加密、设置统一数据格式、设置未登录拦截、线程池
  • Postman接口测试工具
  • appium+jenkins实例构建
  • c#中字段和属性的区别,委托和事件的区别
  • 香橙派使用外设驱动库wiringOP来驱动蜂鸣器
  • 微信小程序Day3笔记
  • 大数据技术之Hadoop:提交MapReduce任务到YARN执行(八)
  • [论文笔记]BiMPM
  • JS判断当前是早上,中午,下午还是晚上
  • 使用Docker部署Gitlab的记录
  • Spark【Spark SQL(二)RDD转换DataFrame、Spark SQL读写数据库 】
  • LabVIEW检测润滑油中的水分和铁颗粒