当前位置: 首页 > news >正文

【NLP概念源和流】 05-引进LSTM网络(第 5/20 部分)

一、说明

        在上一篇博客中,我们讨论了原版RNN架构,也讨论了它的局限性。梯度消失是一个非常重要的缺点,它限制了RNN对较短序列的建模。香草 RNN 在相关输入事件和目标信号之间存在超过 5-10 个离散时间步长的时间滞时无法学习。这基本上限制了香草RNN在许多实际问题上的应用,特别是NLP,因为句子中的单词数量通常远远超过10个。

        长短期记忆(LSTM)是一种流行的循环神经网络架构的更好变体,专门设计用于解决梯度消失问题。LSTM调整了RNN循环单元的内部结构,为消失梯度带来了解决方案。 LSTM 在翻译和序列生成方面的应用取得了巨大成功。在这篇博客中,我们将讨论 LSTM 的神经架构。如果您不熟悉RNN,请参考我之前的博客。

LSTM 神经架构

二、神经架构

        LSTM与我们学到的RNN非常相似,它具有与递归神经网络类似的控制流。在RNN中,信息(隐藏状态/梯度)在进行反向传播时跨时间步不间断地传递。LSTM所做的只是利用简单的门来控制循环网络单元中的梯度传播。LSTM 存储单元使用不同的门处理向前传播时传递信息的数据。让我们看看这些信息是如何在 LSTM 存储单元中处理的,首先让我们定义单元状态,

http://www.lryc.cn/news/106622.html

相关文章:

  • Vue没有node_modules怎么办
  • 企业级高负载web服务器-Tomcat小项目
  • 《golang设计模式》第一部分·创建型模式-03-建造者模式(Builder)
  • git 忽略掉不需要的文件
  • 摄像机sd卡格式化怎么恢复数据?简单五步轻松解决
  • 1-4 AUTOSAR方法论--开发流程
  • Win10查询硬盘序列号
  • 减少错误和重复工作:PDM系统的智能排错功能
  • 【面试题】作用域面试题
  • 08 定时器(下)
  • C++设计模式之适配器设计模式
  • Maven项目解决cannot resolve plugin maven-deploy-plugin:2.7
  • Postgresql源码(110)分析dsm动态共享内存分配与共享内存mq实例
  • 51单片机学习--蜂鸣器播放音乐
  • 【Vue组件eval方法的使用】
  • C++ 多文件结构和编译预处理命令
  • QT实现中英文键盘
  • java中并发编程CompletableFuture和supplyAsync的用法
  • chrony服务器
  • 春秋云镜 CVE-2021-24762
  • K8s中的Service
  • [软件工程] 全局分析规格说明书模板
  • 【JAVASE】封装
  • Java多线程(四)
  • Linux 文件系统预留空间
  • 篇一:单例模式:C++中的独一无二
  • JVM之内存结构
  • C#实现结构体与字节流的相互转化
  • 用LangChain开源框架实现知识机器人
  • HCIP——前期综合实验