当前位置: 首页 > news >正文

NLP 04(GRU)

一、GRU

GRU (Gated Recurrent Unit)也称门控循环单元结构,它也是传统RNN的变体,同LSTM一样能够有效捕捉长序列之间的语义关联 缓解梯度消失或爆炸现象同时它的结构和计算要比LSTM更简单,它的核心结构可以分为两个部分去解析:

更新门、重置门

GRU的内部结构图和计算公式:

1.1 更新门&重置门

Bi-GRU与Bi-LSTM的逻辑相同,都是不改变其内部结构,而是将模型应用两次且方向不同,再将两次得到的LSTM结果进行拼接作为最终输出 

二、GRU优缺点

  • 优点

GRU和LSTM作用相同,在捕捉长序列语义关联时,能有效抑制梯度消失或爆炸,效果都优于传统RNN且计算复杂度相比LSTM要小

  • 缺点

GRU仍然不能完全解决梯度消失问题,同时其作用RNN的变体,有着RNN结构本身的一大弊端,即不可并行计算,这在数据量和模型体量逐步增大的未来,是RNN发展的关键瓶颈。

http://www.lryc.cn/news/179471.html

相关文章:

  • BUUCTF reverse wp 51 - 55
  • WebGL笔记:使用鼠标绘制多个线条应用及绘制动感线性星座
  • nodejs+vue 汽车销售系统elementui
  • leetcode76 Minimum Window Substring
  • 简单工厂模式~
  • 基于Java的会员管理系统设计与实现(源码+lw+部署文档+讲解等)
  • 数据结构 图 并查集 遍历方法 最短路径算法 最小生成树算法 简易代码实现
  • idea Springboot 教师标识管理系统开发mysql数据库web结构java编程计算机网页源码maven项目
  • 2023-9-30 JZ36 二叉搜索树与双向链表
  • 在windows的ubuntu LTS中安装及使用EZ-InSAR进行InSAR数据处理
  • 腾讯mini项目-【指标监控服务重构】2023-08-25
  • 数据挖掘(1)概述
  • YApi Pro
  • AUTOSAR RTE介绍(更新版230925)
  • 深度学习笔记_1、定义神经网络
  • 【Java 进阶篇】MySQL 事务详解
  • Spring修炼之旅(3)自动装配与注解开发
  • 嵌入式Linux应用开发-基础知识-第十六章GPIO和Pinctrl子系统的使用
  • Ubuntu系统下使用apt-get安装Mysql8
  • jenkins联动显示或隐藏参数
  • Error: Activity class {xxx.java} does not exist
  • 保护模式阶段测试-模拟3环0环调用
  • Dart笔记:stream_channel 包用法
  • Java进阶必会JVM-深入浅出Java虚拟机
  • 1200*B. Sorted Adjacent Differences(构造)
  • 恼人的TCP套接字部分发送成功场景
  • ROS2 中的轻量级、自动化、受控回放
  • Egg使用jwt拦截jtoken验证
  • 装饰器模式详解和实现(设计模式 二)
  • 面试问到MySQL模块划分与架构体系怎么办