当前位置：首页 > news >正文

PyTorch -- RNN 快速实践

news 2025/7/8 9:40:52

RNN Layer torch.nn.RNN(input_size,hidden_size,num_layers,batch_first)
- input_size: 输入的编码维度
- hidden_size: 隐含层的维数
- num_layers: 隐含层的层数
- batch_first: ·True 指定输入的参数顺序为：
  - x：[batch, seq_len, input_size]
  - h0：[batch, num_layers, hidden_size]
RNN 的输入：
- x：[seq_len, batch, input_size]
  - seq_len: 输入的序列长度
  - batch: batch size 批大小
- h0：[num_layers, batch, hidden_size]
RNN 的输出：
- y: [seq_len, batch, hidden_size]

在这里插入图片描述

实战之预测 正弦曲线：以下会以此为例，演示 RNN 预测任务的部署
在这里插入图片描述

步骤一：确定 RNN Layer 相关参数值并基于此创建 Net

import numpy as np
from matplotlib import pyplot as pltimport torch
import torch.nn as nn
import torch.optim as optimseq_len     = 50
batch       = 1
num_time_steps = seq_leninput_size  = 1
output_size = input_size
hidden_size = 10  	
num_layers = 1  	
batch_first = True class Net(nn.Module):  ## model 定义def __init__(self):super(Net, self).__init__()self.rnn = nn.RNN(input_size=input_size,hidden_size=hidden_size,num_layers=num_layers,batch_first=batch_first)# for p in self.rnn.parameters():# 	nn.init.normal_(p, mean=0.0, std=0.001)self.linear = nn.Linear(hidden_size, output_size)def forward(self, x, hidden_prev):out, hidden_prev = self.rnn(x, hidden_prev)# out: [batch, seq_len, hidden_size]out = out.view(-1, hidden_size)  # [batch*seq_len, hidden_size]out = self.linear(out) 			 # [batch*seq_len, output_size]out = out.unsqueeze(dim=0)    # [1, batch*seq_len, output_size]return out, hidden_prev

步骤二：确定训练流程

lr=0.01def tarin_RNN():model = Net()print('model:\n',model)criterion = nn.MSELoss()optimizer = optim.Adam(model.parameters(), lr)hidden_prev = torch.zeros(num_layers, batch, hidden_size)  #初始化hl = []for iter in range(100):  # 训练100次start = np.random.randint(10, size=1)[0]  ## 序列起点time_steps = np.linspace(start, start+10, num_time_steps)  ## 序列data = np.sin(time_steps).reshape(num_time_steps, 1)  ## 序列数据x = torch.tensor(data[:-1]).float().view(batch, seq_len-1, input_size)y = torch.tensor(data[1: ]).float().view(batch, seq_len-1, input_size)  # 目标为预测一个新的点output, hidden_prev = model(x, hidden_prev)hidden_prev = hidden_prev.detach()  ## 最后一层隐藏层的状态要 detachloss = criterion(output, y)model.zero_grad()loss.backward()optimizer.step()if iter % 100 == 0:print("Iteration: {} loss {}".format(iter, loss.item()))l.append(loss.item())#############################绘制损失函数#################################plt.plot(l,'r')plt.xlabel('训练次数')plt.ylabel('loss')plt.title('RNN LOSS')plt.savefig('RNN_LOSS.png')return hidden_prev,modelhidden_prev,model = tarin_RNN()

步骤三：测试训练结果

start = np.random.randint(3, size=1)[0]  ## 序列起点
time_steps = np.linspace(start, start+10, num_time_steps)  ## 序列
data = np.sin(time_steps).reshape(num_time_steps, 1)  ## 序列数据
x = torch.tensor(data[:-1]).float().view(batch, seq_len-1, input_size)
y = torch.tensor(data[1: ]).float().view(batch, seq_len-1, input_size)  # 目标为预测一个新的点    predictions = []  ## 预测结果
input = x[:,0,:]
for _ in range(x.shape[1]):input = input.view(1, 1, 1)pred, hidden_prev = model(input, hidden_prev)input = pred  ## 循环获得每个input点输入网络predictions.append(pred.detach().numpy()[0])
x= x.data.numpy()
y = y.data.numpy( )
plt.scatter(time_steps[:-1], x.squeeze(), s=90)
plt.plot(time_steps[:-1], x.squeeze())
plt.scatter(time_steps[1:],predictions)  ## 黄色为预测
plt.show()

在这里插入图片描述

【高阶】上述例子比较简单，便于入门以推理到自己的目标任务，实际 RNN (长时间序列) 训练可能更有难度，可以添加

对于梯度爆炸的解决：

for p in model.parameters()"print(p.grad.norm())  ## 查阅梯度，看看是否爆炸torch.nn.utils.clip_grad_norm_(p, 10)  ## grad 限幅，其中的 norm 后面的_ 表示 in place 操作

对于梯度消失的解决：-> LSTM

另一个很好的实例关于飞行轨迹预测- - RNN-博客链接，可供学习参考
B站视频参考资料

查看全文

http://www.lryc.cn/news/379749.html

SpringBoot 快速入门（保姆级详细教程）

【第18章】Vue实战篇之登录界面

[C++]使用C++部署yolov10目标检测的tensorrt模型支持图片视频推理windows测试通过

分享uniapp + Springboot3+vue3小程序项目实战

Ubuntu 24.04安装zabbix7.0.0图形中文乱码

MybatisPlus 调用原生SQL

1.SG90

【yolov8语义分割】跑通：下载yolov8+预测图片+预测视频

基于STM8系列单片机驱动74HC595驱动两个3位一体的数码管

Jlink下载固件到RAM区

Kotlin基础——Typeclass

DC-DC 高压降压、非隔离AC-DC、提供强大的动力，选择优质电源芯片-（昱灿）

GPT-4o的视觉识别能力，将绕过所有登陆的图形验证码

【LinuxC语言】进程间的通信——管道

CompletableFuture 基本用法

红队攻防渗透技术实战流程：中间件安全：IISNGINXAPACHETOMCAT

如何卸载宝塔面板？

python入门基础知识（错误和异常）

迈巴赫S480升级增强现实AR抬头显示hud比普通抬头显示HUD更好用吗

vivado、vitis2022安装及其注意事项（省时、省空间）

【自动驾驶】ROS小车系统

mysql学习——多表查询

【Gradio】如何设置 Gradio 数据框的样式

【ThreeJS】Threejs +Vue3 开发基础

cocos 如何使用九宫格图片，以及在微信小程序上失效。

Spring企业开发核心框架

相关文章：