当前位置: 首页 > news >正文

双向长短期记忆神经网络BiLSTM

先说一下LSTM

LSTM 是一种特殊的 RNN,它通过引入门控机制来解决传统 RNN 的长期依赖问题

LSTM 的结构包含以下几个关键组件:

  1. 输入门(input gate):决定当前时间步的输入信息对细胞状态的影响程度。
  2. 遗忘门(forgetgate):决定上一个时间步的细胞状态对当前时间步的影响程度。
  3. 细胞状态(cell state):用于在不同时间步之间传递和存储信息。
  4. 输出门(output gate):决定细胞状态对当前时间步的输出影响程度。
  5. 隐藏状态(hiddenstate):当前时间步的输出,也是下一个时间步的输入。

LSTM内部工作原理:

我们假设:h为LSTM单元的隐藏层输出c为LSTM内存单元的值x输入数据

  • 1、计算遗忘门的值𝑓(𝑡)
  • 2、 计算当前时刻的输入结点𝑔(𝑡)g_((t))𝑊(𝑥𝑔)W_((xg))𝑊(h𝑔)W_((hg))𝑊(𝑐𝑔)W_((cg))分别是输入数据和上一时刻LSTM 单元输出的权值:
  • 3、计算输入门 (input gate) 的值𝑖(𝑡)i_((t))。输入门用来控制当前输入数据对记忆单元状态值的影响。

  • 4、计算当前时刻记忆单元的状态值𝑐(𝑡)c_((t))

  • 5、计算输出门𝑜(𝑡)o_((t))。输出门用来控制记忆单元状态值的输出。

  • 6、最后计算LSTM单元的输出。

长短期记忆神经网络(LSTM)的计算公式:

双向长短期记忆神经网络

双向长短期记忆神经网络(BiLSTM)的计算公式:

Bidirectional Long Short-Term Memory, BiLSTM

它是传统长短期记忆网络(Long Short-Term Memory, LSTM)的一种扩展形式,结合了正向LSTM和反向LSTM来获取更完整的上下文信息。从而通过BiLSTM可以更好的捕捉双向的语义依赖.

BiLSTM通过添加一个反向层来实现双向读取。具体而言,它使用两个LSTM网络,一个按照正向顺序处理输入序列,另一个按照反向顺序处理输入序列。这样,在每个时间步骤,每个LSTM单元都能够同时访问前面和后面的上下文信息。

http://www.lryc.cn/news/383052.html

相关文章:

  • python基础篇(4):range语句
  • 基于STM32的简易计算器proteus仿真设计(仿真+程序+设计报告+讲解视频)
  • 小程序onLoad 和 onShow
  • 抖音直播违规规定有哪些?(直播违禁词汇总表)
  • 安卓 jetpack compose
  • JavaWeb系列十九: jQuery的DOM操作 上
  • JavaWeb系列十一: Web 开发会话技术(Cookie, Session)
  • 【激光雷达使用记录】—— 如何在ubuntu中利用ros自带的rviz工具实时可视化雷达点云的数据
  • 运行项目报错(java: 无效的目标发行版: 17)项目jdk版本不兼容,修改Java编译器配置
  • 一道session文件包含题
  • vuex数据持久化
  • MySQL之复制(十)
  • Spring MVC数据绑定和响应——简单数据绑定(一)默认类型数据绑定
  • 短视频平台自动化插件编写需要用到的源代码分享!
  • 安卓下载以来总是要添加maven下载地址,放在哪?
  • springboot多数据源应用,A服务依赖于B服务jar包,A服务和B服务业务数据分别入自己的库如何做?
  • 20240626 每日AI必读资讯
  • C语言经典算法题第一题
  • 计算预卷积特征
  • Python 入门 —— 描述器
  • 测试驱动开发TDD
  • [论文笔记]Mixture-of-Agents Enhances Large Language Model Capabilities
  • Redis 7.x 系列【6】数据类型之字符串(String)
  • 指针(一)
  • harmony鸿蒙下实现bc交互的方式和方法
  • 【MySQL进阶之路 | 高级篇】索引的声明与使用
  • 探索Java中的设计模式:从单例到工厂模式
  • 表单(forms)
  • Geoserver源码解读四 REST服务
  • 硬件开发笔记(二十一):外部搜索不到的元器件封装可尝试使用AD21软件的“ManufacturerPart Search”功能