当前位置: 首页 > news >正文

pytorch-多分类实战之手写数字识别

目录

  • 1. 网络设计
  • 2. 代码实现
    • 2.1 网络代码
    • 2.2 train
  • 3. 完整代码

1. 网络设计

输入是手写数字图片28x28,输出是10个分类0~9,有两个隐藏层,如下图所示:
在这里插入图片描述

2. 代码实现

2.1 网络代码

第一层将784降维到200,第二次使用200不降维,输出层200降维到10,每一层之后加一个激活函数relu,每一层都需要梯度信息所以requires_grad=True;
forward函数最后不要加softmax,因为后面CrossEntropyLoss中包含了softmax操作。
在这里插入图片描述

2.2 train

优化目标是w1、b1、w2、b2、w3、b3,使用SGD优化器,使用CrossEntropyLoss计算loss
在这里插入图片描述

3. 完整代码

import  torch
import  torch.nn as nn
import  torch.nn.functional as F
import  torch.optim as optim
from    torchvision import datasets, transformsbatch_size=200
learning_rate=0.01
epochs=10train_loader = torch.utils.data.DataLoader(datasets.MNIST('../data', train=True, download=True,transform=transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.1307,), (0.3081,))])),batch_size=batch_size, shuffle=True)
test_loader = torch.utils.data.DataLoader(datasets.MNIST('../data', train=False, transform=transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.1307,), (0.3081,))])),batch_size=batch_size, shuffle=True)w1, b1 = torch.randn(200, 784, requires_grad=True),\torch.zeros(200, requires_grad=True)
w2, b2 = torch.randn(200, 200, requires_grad=True),\torch.zeros(200, requires_grad=True)
w3, b3 = torch.randn(10, 200, requires_grad=True),\torch.zeros(10, requires_grad=True)# torch.nn.init.kaiming_normal_(w1)
# torch.nn.init.kaiming_normal_(w2)
# torch.nn.init.kaiming_normal_(w3)def forward(x):x = x@w1.t() + b1x = F.relu(x)x = x@w2.t() + b2x = F.relu(x)x = x@w3.t() + b3x = F.relu(x)return xoptimizer = optim.SGD([w1, b1, w2, b2, w3, b3], lr=learning_rate)
criteon = nn.CrossEntropyLoss()for epoch in range(epochs):for batch_idx, (data, target) in enumerate(train_loader):data = data.view(-1, 28*28)logits = forward(data)loss = criteon(logits, target)optimizer.zero_grad()loss.backward()# print(w1.grad.norm(), w2.grad.norm())optimizer.step()if batch_idx % 100 == 0:print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(epoch, batch_idx * len(data), len(train_loader.dataset),100. * batch_idx / len(train_loader), loss.item()))test_loss = 0correct = 0for data, target in test_loader:data = data.view(-1, 28 * 28)logits = forward(data)test_loss += criteon(logits, target).item()pred = logits.data.max(1)[1]correct += pred.eq(target.data).sum()test_loss /= len(test_loader.dataset)print('\nTest set: Average loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)\n'.format(test_loss, correct, len(test_loader.dataset),100. * correct / len(test_loader.dataset)))

如下图:
未使用torch.nn.init.kaiming_normal_(w1)初始化参数的情况,可以看出Loss在2.302585后就不下降了。
在这里插入图片描述
如下图:使用了torch.nn.init.kaiming_normal_(w1)初始化参数的情况下,Loss下降还是比较快的。
在这里插入图片描述
因此使用好的初始化参数对网络的训练起到至关重要的作用

http://www.lryc.cn/news/337430.html

相关文章:

  • httpsok-快速申请谷歌SSL免费证书
  • LiveGBS流媒体平台GB/T28181功能-国标级联中如何自定义通道国标编号编辑通道编号保持唯一性
  • mysql 大表凌晨定时删除数据
  • ArcGIS和ArcGIS Pro快速加载ArcGIS历史影像World Imagery Wayback
  • 数据仓库的—数据仓库的体系架构
  • 【C/C++基础知识】const 关键字
  • Docker之数据卷和Dockerfile
  • pull拉取最新代码
  • 工控 modbusTCP 报文
  • 在Ubuntu服务器上快速安装一个redis并提供远程服务
  • 玩机进阶教程------手机定制机 定制系统 解除系统安装软件限制的一些步骤解析
  • Bilstm双向长短期神经网络多输入单输出回归分析
  • ELK+Filebeat日志分析系统
  • flex吃干抹净
  • 【单片机毕业设计8-基于stm32c8t6的RFID校园门禁系统】
  • uni-app web端使用getUserMedia,摄像头拍照
  • 2024-简单点-观察者模式
  • STM32—DMA直接存储器访问详解
  • 【JavaEE初阶系列】——网络编程 TCP客户端/服务器 程序实现
  • CMake构建OpenCv并导入QT项目过程中出现的问题汇总
  • AcWing 796. 子矩阵的和——算法基础课题解
  • macos 查看 远程服务器是否开放某个端口
  • GraphQL注入
  • 以太坊源码阅读01
  • Spark-Scala语言实战(15)
  • 【SpringBoot XSS存储漏洞 拦截器】Java纯后端对于前台输入值的拦截校验实现 一个类加一个注解结束
  • 【微信小程序】canvas开发笔记
  • TripoSR: Fast 3D Object Reconstruction from a Single Image 论文阅读
  • u盘为什么一插上电脑就蓝屏,u盘一插电脑就蓝屏
  • 【Redis】redis面试相关积累