当前位置：首页 > news >正文

NLP：初识RNN模型（概念、分类、作用）

news 2025/7/10 11:38:25

本文目录：

一、RNN相关概念
二、RNN模型的基本运作
三、RNN的分类
- （一）根据输入和输出的结构分类
- - 1. N vs N - RNN
  - 2. N vs 1 - RNN
  - 3. 1 vs N - RNN
  - 4. N vs M - RNN
- （二）根据RNN的内部构造分类
- - 1.传统RNN ：简单时间序列预测（如股票价格短期趋势）。
  - 2.LSTM 长短期记忆网络）：机器翻译、语音识别（需长程依赖的任务）。
  - 3. Bi-LSTM（双向LSTM）：命名实体识别（NER）、情感分析。
  - 4. GRU （门控循环单元）：文本生成、视频帧预测。
  - 5. Bi-GRU（双向GRU）：实时性要求较高的任务（如在线评论情感分析）。
附赠1：（N vs N、 N vs 1、 1 vs N 、N vs M ）RNN对比
附赠2：（传统RNN 、 LSTM 、 Bi-LSTM 、 GRU 、 Bi-GRU）RNN对比

前言：前面几篇文章讲解了NLP数据的基本处理，从这篇文章开始做NLP相关模型的普及。。。

首先普及RNN模型。

一、RNN相关概念

RNN(Recurrent Neural Network), 中文称作循环神经网络, 它一般以序列数据（即数值与所在位置均包含重要信息的数据，如时间序列、文本、语音等）为输入, 通过网络内部的结构设计有效捕捉序列之间的关系特征, 一般也是以序列形式进行输出。

其核心特点是具有记忆能力，能够利用前一时刻的隐藏状态影响当前时刻的输出，从而捕捉序列中的动态信息。

一般单层神经网络结构:
在这里插入图片描述

RNN单层网络结构:

在这里插入图片描述
以时间步对RNN进行展开后的单层网络结构:

RNN的优缺点：

在这里插入图片描述

二、RNN模型的基本运作

RNN常用于NLP的文本分类、情感分析、意图识别等任务。

下面我们将以一个用户意图识别的例子进行简单的分析:
在这里插入图片描述
第一步: 用户输入了"What time is it ?", 我们首先对它进行基本的分词, 因为RNN是按照顺序工作的, 每次只接收一个单词进行处理。

第二步: 首先将单词"What"输送给RNN, 它将产生一个隐层输出O1。

第三步: 继续将单词"time"输送给RNN, 但此时RNN不仅仅利用"time"来产生输出O2, 还会使用来自上一层隐层输出O1作为输入信息。

在这里插入图片描述

第四步: 重复这样的步骤, 直到处理完所有的单词。

在这里插入图片描述
第五步: 最后，将隐层输出O5经过处理来解析用户意图。

三、RNN的分类

这里我们将从两个角度对RNN模型进行分类. 第一个角度是输入和输出的结构, 第二个角度是RNN的内部构造。

（一）根据输入和输出的结构分类

1. N vs N - RNN

在这里插入图片描述

在这里插入图片描述

2. N vs 1 - RNN

在这里插入图片描述

在这里插入图片描述

3. 1 vs N - RNN

在这里插入图片描述

4. N vs M - RNN

在这里插入图片描述

（二）根据RNN的内部构造分类

1.传统RNN ：简单时间序列预测（如股票价格短期趋势）。

在这里插入图片描述

2.LSTM 长短期记忆网络）：机器翻译、语音识别（需长程依赖的任务）。

在这里插入图片描述

3. Bi-LSTM（双向LSTM）：命名实体识别（NER）、情感分析。

在这里插入图片描述

4. GRU （门控循环单元）：文本生成、视频帧预测。

在这里插入图片描述

5. Bi-GRU（双向GRU）：实时性要求较高的任务（如在线评论情感分析）。

在这里插入图片描述

重点是传统RNN、LSTM和GRU。

文章的最后~

附赠1：（N vs N、 N vs 1、 1 vs N 、N vs M ）RNN对比

在这里插入图片描述

附赠2：（传统RNN 、 LSTM 、 Bi-LSTM 、 GRU 、 Bi-GRU）RNN对比

在这里插入图片描述

今天的分享到此结束。

http://www.lryc.cn/news/583252.html

相关文章：

继承与多态：面向对象编程的两大支柱

stockapi股票实时tick数据，技术指标macd，kdj，cci，日k线数据

如何将FPGA设计的验证效率提升1000倍以上(3)

oracle ocp题库有多少道题，以及题库背诵技巧

JavaEE初阶第八期：解锁多线程，从 “单车道” 到 “高速公路” 的编程升级（六）

软件设计师中级概念题

Selenium+Pytest自动化测试框架实战前言#

汽车工业制造领域与数字孪生技术的关联性研究

Microsoft AZ-305 Exam Question

迁移Oracle SH 示例 schema 到 PostgreSQL

亚马逊广告进阶指南：长尾词应如何去挖掘

RapidRAW RAW 图像编辑器

游戏开发学习记录

码云创建分支

分库分表之实战-sharding-JDBC绑定表配置实战

掌握PDF转CAD技巧，提升工程设计效率

模型内部进行特征提取时，除了“减法”之外，还有哪些技术

Android ttyS2无法打开该如何配置 + ttyS0和ttyS1可以

BEV感知算法：自动驾驶的“上帝视角“革命

c语言学习_函数递归2

深度学习模型在C++平台的部署

Spring Boot微服务中集成gRPC实践经验分享

1️⃣理解大语言模型

百度文心一言开源ERNIE-4.5深度测评报告：技术架构解读与性能对比

Shell 脚本0基础教学（一）

【计算机组成原理——知识点总结】-（总线与输入输出设备）-学习笔记总结-复习用

Energy-Based Transformers：实现通用系统2思维的新范式

HOOPS Communicator 2025.5.0版本更新速览：性能、测量与UI全面优化

C++入门基础篇（一）

《【第五篇】图片处理自动化：让你的视觉内容更专业！：图片处理基础与批量裁剪》