当前位置：首页 > news >正文

10-pytorch-完整模型训练

news 2025/9/14 18:54:28

b站小土堆pytorch教程学习笔记

一、从零开始构建自己的神经网络

1.模型构建

#准备数据集
import torch
import torchvision
from torch.utils.tensorboard import SummaryWriterfrom model import *
from torch.utils.data import DataLoadertrain_data=torchvision.datasets.CIFAR10('dataset',train=True,transform=torchvision.transforms.ToTensor(),download=True)
test_data=torchvision.datasets.CIFAR10('dataset',train=False,transform=torchvision.transforms.ToTensor(),download=True)
#查看训练数据集和测试集大小
train_data_size=len(train_data)
test_data_size=len(test_data)
print('训练数据集长度为：{}'.format(train_data_size))#训练数据集长度为：50000
print('测试数据集长度为：{}'.format(test_data_size))#测试数据集长度为：10000#利用datalo加载数据集
train_dataloader=DataLoader(train_data,batch_size=64)
test_dataloader=DataLoader(test_data,batch_size=64)#搭建神经网络，在model文件中搭建网络，在此文件中引用
han=Han()#损失函数
loss_fn=nn.CrossEntropyLoss()#优化器
# learning_rate=0.01
learning_rate=1e-2
optimizer=torch.optim.SGD(han.parameters(),lr=learning_rate)#设置训练网络的相关参数
total_train_step = 0#记录训练的次数
total_test_step = 0#记录测试的次数
epoch=10#训练轮数#添加tensorboard
writer=SummaryWriter('logs/train')for i in range(10):print('-------第{}轮训练开始-------'.format(i+1))for data in train_dataloader:imgs,target=dataoutput=han(imgs)loss=loss_fn(output,target)#优化器优化模型optimizer.zero_grad()#梯度清零loss.backward()#反向传播计算梯度optimizer.step()#参数优化total_train_step=total_train_step+1if total_train_step % 100==0:#逢100打印print('训练次数：{},loss:{}'.format(total_train_step,loss.item()))#loss.item()取出tensor类型的数字writer.add_scalar('train_loss',loss.item(),total_train_step)#每训练完一轮将在测试集上跑一遍，评估其训练效果total_test_loss=0with torch.no_grad():for data in test_dataloader:imgs,target=dataoutput=han(imgs)loss=loss_fn(output,target)total_test_loss=total_test_loss+loss.item()print('所有测试集上的损失:{}'.format(total_test_loss))writer.add_scalar('test_loss',total_test_loss,total_test_step)total_test_step+=1#保存每一轮模型torch.save(han,'han_{}.pth'.format(i))print('模型已保存')
writer.close()

import torch
from torch import nnclass Han(nn.Module):def __init__(self):super(Han, self).__init__()self.model = nn.Sequential(nn.Conv2d(3, 32, kernel_size=5, stride=1, padding=2),nn.MaxPool2d(2),nn.Conv2d(32, 32, kernel_size=5, stride=1, padding=2),nn.MaxPool2d(2),nn.Conv2d(32, 64, kernel_size=5, stride=1, padding=2),nn.MaxPool2d(2),nn.Flatten(),nn.Linear(64 * 4 * 4, 64),nn.Linear(64, 10))def forward(self, x):x = self.model(x)return xif __name__ == '__main__':han=Han()input=torch.ones(64,3,32,32)output=han(input)print(output.shape)#torch.Size([64, 10])10表示十个类别输出概率

结果如下：
在这里插入图片描述

2.使用argmax计算整体正确率

#每训练完一轮将在测试集上跑一遍，评估其训练效果total_test_loss=0total_acc=0with torch.no_grad():for data in test_dataloader:imgs,target=dataoutput=han(imgs)loss=loss_fn(output,target)total_test_loss=total_test_loss+loss.item()acc=(output.argmax(1)==target).sum()#(1)横着看total_acc+=accprint('所有测试集上的损失:{}'.format(total_test_loss))print('整体测试集上的正确率：{}'.format(total_acc/test_data_size))writer.add_scalar('test_loss',total_test_loss,total_test_step)writer.add_scalar('test_acc', total_acc/test_data_size, total_test_step)total_test_step+=1

整体测试集上的正确率：0.27480000257492065

3.当训练或测试时存在dropout层或batch normal层，则需要在训练训练和测试前加入：

#训练前
han.train()
#测试前
han.eval()

二、使用GPU

网络模型、数据（输入、标注）、损失函数调用cuda()

1.方式1

#模型
if torch.cuda.is_available():han=han.cuda()

#损失函数
loss_fn=nn.CrossEntropyLoss()
loss_fn=loss_fn.cuda()

imgs,target=data
imgs=imgs.cuda()
target=target.cuda()

2.方式2

#定义训练设备
device=torch.device('cuda')

han=han.to(device)

imgs = imgs.to(device)
target = target.to(device)

查看全文

http://www.lryc.cn/news/305465.html

高级RAG：重新排名，从原理到实现的两种主流方法

使用logicflow流程图实例

Stable Diffusion 绘画入门教程（webui）-ControlNet(IP2P）

五力分析（Porter‘s Five Forces）

十一、Qt数据库操作

【Spring】IoC容器控制反转与 DI依赖注入 XML实现版本第二期

神经网络系列---感知机(Neuron)

k8s（2）

利用nginx内部访问特性实现静态资源授权访问

fly-barrage 前端弹幕库（1）：项目介绍

jetcache如果一个主体涉及多个缓存时编辑或者删除时如何同时失效多个缓存

uni-app 实现拍照后给照片加水印功能

【ArcGIS】利用DEM进行水文分析：流向/流量等

论文阅读笔记——PathAFL：Path-Coverage Assisted Fuzzing

C语言中各种运算符用法

pythonJax小记（五）：python: 使用Jax深度图像（正交投影和透视投影之间的转换）（持续更新，评论区可以补充）

web安全学习笔记【16】——信息打点（6）

145.二叉树的后序遍历

ssh远程连接免密码访问

Vue-Json-Schema-Form: 如何基于模板定制前端页面

保存Json对象到数据库

《Docker 简易速速上手小册》第3章 Dockerfile 与镜像构建（2024 最新版）

【Python笔记-设计模式】适配器模式

二分算法（c++版）

【C#】用于基于 UV DLP 的 3D 打印机的切片软件源码解析（一）DLP原理 GUI

Javase补充-Arrays类的常用方法汇总

微信小程序-人脸检测-眨眼驱动ESP32蓝牙设备灯

怎么在wifi中实现手机和电脑文件互传

07 STL 简介

unity学习（39）——创建（create）角色脚本（panel）——静态（static）

一、从零开始构建自己的神经网络

1.模型构建

2.使用argmax计算整体正确率

3.当训练或测试时存在dropout层或batch normal层，则需要在训练训练和测试前加入：

二、使用GPU

1.方式1

2.方式2

相关文章：