当前位置: 首页 > news >正文

lstm基础知识

lstm前言

LSTM(Long short-term memory)通过刻意的设计来避免长期依赖问题,是一种特殊的RNN。长时间记住信息实际上是 LSTM 的默认行为,而不是需要努力学习的东西!

在标准的RNN中,这个重复模块具有非常简单的结构,例如只有单个tanh层,如下图所示。


LSTM具有同样的结构,但是重复的模块拥有不同的结构,如下图所示。与RNN的不同,这里有四个网络层,并且以一种非常特殊的方式进行交互。
在这里插入图片描述

公式推导

在这里插入图片描述

三个门的作用

ft门的作用是选择性遗忘部分记忆,it门决定了新的知识有哪些需要被记住,意思就是对新知识进行取舍,g(新的记忆单元)根据当前的输入和前一个隐藏状态计算出来的一个潜在的新记忆。它本身并不决定新信息是否要存入细胞状态,而只是提供了一种可能的输入。ot门决定了输出哪些新的知识。

总结

总结:我刚考完高等数学,下一门考线性代数,首先通过遗忘门,进行选择性遗忘旧的知识,然后通过更新门,将旧的知识和已经学习的新的知识进行整合。形成目前所学到的全部知识,然后和输出门进行结合,转化成考试的能力,也就是记住线性代数所要考察的考点,最后输出考试所得的分数。

http://www.lryc.cn/news/463317.html

相关文章:

  • Linux :at crontab简述
  • Python,Swift,Haskell三种语言在使用正则表达式上的方法对比
  • leetcode力扣刷题系列——【三角形的最大高度】
  • 工业相机解决方案
  • 设计一个高效的日志分析系统:自动检测错误日志的实用指南
  • 英语学习--如果你的父母不听你的话
  • LeetCode:3258.统计满足k约束的子串数量 I(滑动窗口 Java)
  • 如果用Java设计MySQL中表级锁、行级锁和间歇锁会是怎么的?
  • GIT batch的支持中文的方法和系统建议
  • 骑砍霸主MOD天芒传奇Ⅱ·前传-序章
  • 神经网络量化基础
  • 飞机大战告尾
  • 支持向量机SVM原理详解
  • 使用JMeter进行Spring Boot接口的压力测试
  • C++学习笔记----9、发现继承的技巧(三)---- 尊重父类(1)
  • 启动service报错ORA-44317: database open read-only
  • GNU/Linux - Savannah项目
  • Debug-028-el-carousel走马灯-当展示图片为2的问题处理
  • TapData 知识库 | 一文吃透数据整合(Data Consolidation)
  • MySQL数据的导出
  • 微服务--OpenFeign【重点】
  • 【力扣打卡系列】滑动窗口与双指针(两数之和)
  • 蚂蚁华东师范大学:从零开始学习定义和解决一般优化问题LLMOPT
  • 价格游戏的终章:品牌如何在通货膨胀时代智取市场
  • CVTE Android面试题及参考答案
  • Docker实战:从入门到进阶
  • Jupyter Notebook汉化(中文版)
  • C#的小数位保留以及四舍五入
  • KNNImputer
  • RHCE例行性工作笔记