当前位置: 首页 > news >正文

NLP:初识RNN模型(概念、分类、作用)

本文目录:

  • 一、RNN相关概念
  • 二、RNN模型的基本运作
  • 三、RNN的分类
    • (一)根据输入和输出的结构分类
      • 1. N vs N - RNN
      • 2. N vs 1 - RNN
      • 3. 1 vs N - RNN
      • 4. N vs M - RNN
    • (二)根据RNN的内部构造分类
      • 1.传统RNN :简单时间序列预测(如股票价格短期趋势)。
      • 2.LSTM 长短期记忆网络):机器翻译、语音识别(需长程依赖的任务)。
      • 3. Bi-LSTM(双向LSTM) :命名实体识别(NER)、情感分析。
      • 4. GRU (门控循环单元):文本生成、视频帧预测。
      • 5. Bi-GRU(双向GRU):实时性要求较高的任务(如在线评论情感分析)。
  • 附赠1:(N vs N、 N vs 1、 1 vs N 、N vs M )RNN对比
  • 附赠2:(传统RNN 、 LSTM 、 Bi-LSTM 、 GRU 、 Bi-GRU)RNN对比

前言:前面几篇文章讲解了NLP数据的基本处理,从这篇文章开始做NLP相关模型的普及。。。

首先普及RNN模型

一、RNN相关概念

RNN(Recurrent Neural Network), 中文称作循环神经网络, 它一般以序列数据(即数值与所在位置均包含重要信息的数据,如时间序列、文本、语音等)为输入, 通过网络内部的结构设计有效捕捉序列之间的关系特征, 一般也是以序列形式进行输出。

其核心特点是具有记忆能力,能够利用前一时刻的隐藏状态影响当前时刻的输出,从而捕捉序列中的动态信息。

一般单层神经网络结构:
在这里插入图片描述

RNN单层网络结构:

在这里插入图片描述
以时间步对RNN进行展开后的单层网络结构:
在这里插入图片描述

RNN的优缺点:

在这里插入图片描述

二、RNN模型的基本运作

RNN常用于NLP的文本分类、情感分析、 意图识别等任务。

下面我们将以一个用户意图识别的例子进行简单的分析:
在这里插入图片描述
第一步: 用户输入了"What time is it ?", 我们首先对它进行基本的分词, 因为RNN是按照顺序工作的, 每次只接收一个单词进行处理。
在这里插入图片描述
第二步: 首先将单词"What"输送给RNN, 它将产生一个隐层输出O1。
在这里插入图片描述

第三步: 继续将单词"time"输送给RNN, 但此时RNN不仅仅利用"time"来产生输出O2, 还会使用来自上一层隐层输出O1作为输入信息。

在这里插入图片描述

第四步: 重复这样的步骤, 直到处理完所有的单词。

在这里插入图片描述
第五步: 最后,将隐层输出O5经过处理来解析用户意图。
在这里插入图片描述

三、RNN的分类

这里我们将从两个角度对RNN模型进行分类. 第一个角度是输入和输出的结构, 第二个角度是RNN的内部构造。

(一)根据输入和输出的结构分类

1. N vs N - RNN

在这里插入图片描述

在这里插入图片描述

2. N vs 1 - RNN

在这里插入图片描述

在这里插入图片描述

3. 1 vs N - RNN

在这里插入图片描述
在这里插入图片描述

4. N vs M - RNN

在这里插入图片描述
在这里插入图片描述

(二)根据RNN的内部构造分类

1.传统RNN :简单时间序列预测(如股票价格短期趋势)。

在这里插入图片描述

2.LSTM 长短期记忆网络):机器翻译、语音识别(需长程依赖的任务)。

在这里插入图片描述

3. Bi-LSTM(双向LSTM) :命名实体识别(NER)、情感分析。

在这里插入图片描述

4. GRU (门控循环单元):文本生成、视频帧预测。

在这里插入图片描述

5. Bi-GRU(双向GRU):实时性要求较高的任务(如在线评论情感分析)。

在这里插入图片描述

重点是传统RNN、LSTM和GRU。

文章的最后~

附赠1:(N vs N、 N vs 1、 1 vs N 、N vs M )RNN对比

在这里插入图片描述

附赠2:(传统RNN 、 LSTM 、 Bi-LSTM 、 GRU 、 Bi-GRU)RNN对比

在这里插入图片描述

今天的分享到此结束。

http://www.lryc.cn/news/583252.html

相关文章:

  • 继承与多态:面向对象编程的两大支柱
  • stockapi股票实时tick数据,技术指标macd,kdj,cci,日k线数据
  • 如何将FPGA设计的验证效率提升1000倍以上(3)
  • oracle ocp题库有多少道题,以及题库背诵技巧
  • JavaEE初阶第八期:解锁多线程,从 “单车道” 到 “高速公路” 的编程升级(六)
  • 软件设计师中级概念题
  • Selenium+Pytest自动化测试框架实战前言#
  • 汽车工业制造领域与数字孪生技术的关联性研究​
  • Microsoft AZ-305 Exam Question
  • 迁移Oracle SH 示例 schema 到 PostgreSQL
  • 亚马逊广告进阶指南:长尾词应如何去挖掘
  • RapidRAW RAW 图像编辑器
  • 游戏开发学习记录
  • 码云创建分支
  • 分库分表之实战-sharding-JDBC绑定表配置实战
  • 掌握PDF转CAD技巧,提升工程设计效率
  • 模型内部进行特征提取时,除了“减法”之外,还有哪些技术
  • Android ttyS2无法打开该如何配置 + ttyS0和ttyS1可以
  • BEV感知算法:自动驾驶的“上帝视角“革命
  • c语言学习_函数递归2
  • 深度学习模型在C++平台的部署
  • Spring Boot微服务中集成gRPC实践经验分享
  • 1️⃣理解大语言模型
  • 百度文心一言开源ERNIE-4.5深度测评报告:技术架构解读与性能对比
  • Shell 脚本0基础教学(一)
  • 【计算机组成原理——知识点总结】-(总线与输入输出设备)-学习笔记总结-复习用
  • Energy-Based Transformers:实现通用系统2思维的新范式
  • HOOPS Communicator 2025.5.0版本更新速览:性能、测量与UI全面优化
  • C++入门基础篇(一)
  • 《【第五篇】图片处理自动化:让你的视觉内容更专业!:图片处理基础与批量裁剪》