当前位置: 首页 > news >正文

神经网络分类任务(手写数字识别)

1.Mnist分类任务

  • 网络基本构建与训练方法,常用函数解析

  • torch.nn.functional模块

  • nn.Module模块

学习方法:边用边查,多打印,duo'gua

使用jupyter的优点,可以打印出每一个步骤。

2.读取数据集

自动下载

%matplotlib inline
#查看本机torch的版本
import torch
print(torch.__version__)#打印torch的版本

加载并读取数据集

from pathlib import Path
import requestsDATA_PATH = Path("data")
PATH = DATA_PATH / "mnist"PATH.mkdir(parents=True, exist_ok=True)URL = "http://deeplearning.net/data/mnist/"
FILENAME = "mnist.pkl.gz"if not (PATH / FILENAME).exists():content = requests.get(URL + FILENAME).content(PATH / FILENAME).open("wb").write(content)import pickle
import gzipwith gzip.open((PATH / FILENAME).as_posix(), "rb") as f:((x_train, y_train), (x_valid, y_valid), _) = pickle.load(f, encoding="latin-1")

观察数据的结构

784是mnist数据集每个样本的像素点个数

print(x_train[0].shape)
print(x_train.shape)
y_train

显示一个记录的灰度图

from matplotlib import pyplot
import numpy as nppyplot.imshow(x_train[0].reshape((28, 28)), cmap="gray")
print(x_train.shape)

 numpy和torch的区别:
torch->gpu->tensor
numpy->cpu->ndarray

数据转化:

import torchx_train, y_train, x_valid, y_valid = map(torch.tensor, (x_train, y_train, x_valid, y_valid)
)
n, c = x_train.shape
x_train, x_train.shape, y_train.min(), y_train.max()
print(x_train, y_train)
print(x_train.shape)
print(y_train.min(), y_train.max())

3  torch.nn.functional 很多层和函数在这里都会见到

torch.nn.functional中有很多功能,后续会常用的。那什么时候使用nn.Module,什么时候使用nn.functional呢?一般情况下,如果模型有可学习的参数,最好用nn.Module,其他情nn.functional相对更简单一些

import torch.nn.functional as Floss_func = F.cross_entropydef model(xb):return xb.mm(weights) + biasbs = 64
xb = x_train[0:bs]  # a mini-batch from x
yb = y_train[0:bs]
weights = torch.randn([784, 10], dtype = torch.float,  requires_grad = True) 
#线性代数的相关知识,weights与输入想乘之后,需要输出的格式为10分类,所以的weights的矩阵为(784,10)
bs = 64
bias = torch.zeros(10, requires_grad=True)#偏执的设置,常数值作为初始化,因为这个东西对模型的影###响不是很大。print(loss_func(model(xb), yb)):#计算真实值和预测值之间的误差

4  创建一个model来更简化代码

  • 必须继承nn.Module且在其构造函数中需调用nn.Module的构造函数
  • 无需写反向传播函数,nn.Module能够利用autograd自动实现反向传播
  • Module中的可学习参数可以通过named_parameters()或者parameters()返回迭代器
from torch import nnclass Mnist_NN(nn.Module):def __init__(self):super().__init__()self.hidden1 = nn.Linear(784, 128)self.hidden2 = nn.Linear(128, 256)self.out  = nn.Linear(256, 10)#定义前向传播,torch有一个优点:前向传播自己定义,反向传播自动实现。def forward(self, x):x = F.relu(self.hidden1(x))x = F.relu(self.hidden2(x))x = self.out(x)return x
net = Mnist_NN()
print(net)

可以打印我们定义好名字里的权重和偏置项

for name, parameter in net.named_parameters():print(name, parameter,parameter.size())

5  使用TensorDataset和DataLoader来简化

from torch.utils.data import TensorDataset
from torch.utils.data import DataLoadertrain_ds = TensorDataset(x_train, y_train)
train_dl = DataLoader(train_ds, batch_size=bs, shuffle=True)#shuffle=True:洗牌的操作。
valid_ds = TensorDataset(x_valid, y_valid)
valid_dl = DataLoader(valid_ds, batch_size=bs * 2)def get_data(train_ds, valid_ds, bs):return (DataLoader(train_ds, batch_size=bs, shuffle=True),DataLoader(valid_ds, batch_size=bs * 2),)
  • 一般在训练模型时加上model.train(),这样会正常使用Batch Normalization和 Dropout
  • 测试的时候一般选择model.eval(),这样就不会使用Batch Normalization和 Dropout
http://www.lryc.cn/news/34884.html

相关文章:

  • FCN网络(Fully Convolutional Networks)
  • 随想录二刷Day15——二叉树
  • docker-compose部署kafka服务时如何同时允许内外网访问?
  • 数据结构刷题(二十):17电话号码的字母组合、39组合总和、40组合总和II
  • Java面试总结(五)
  • 三维人脸实践:基于Face3D的渲染、生成与重构 <二>
  • 在linux上部署Java项目
  • 线性表的接口
  • spark三种操作模式的不同点分析
  • Vue3做出B站【bilibili】 Vue3+TypeScript【快速入门一篇文章精通系列(一)前端项目案例】
  • 猜数游戏--课后程序(Python程序开发案例教程-黑马程序员编著-第3章-课后作业)
  • Nvidia jetson nano 部署yolov5_技术文档
  • 获取当前天数前N天
  • Linux---基本指令
  • 【UE4 RTS游戏】02-摄像机运动_完成摄像机在X轴上运动的相关步骤
  • Kubernetes学习(五)持久化存储
  • 下一个7年,保持期待、持续思考,酷雷曼继续向前!
  • 天梯赛训练L1-010--L1-012
  • 三分钟完成Stable Diffusion本地安装(零基础体验AI绘画)
  • 电子台账:教程目录及软件下载
  • 多态的优势和弊端
  • android h5考勤管理系统myeclipse开发mysql数据库编程服务端java计算机程序设计
  • 第二道pwn题:shellcode
  • 《华为数据之道》读书笔记
  • C++源码pcl1.13.0库编译环境搭建及配置
  • Idea工具单工程使用卡顿设置
  • Android 9.0 Camera2退出时屏幕旋转为横屏
  • 【云原生】rancher2.6部署MySQL—2023.03
  • 行测-判断推理-图形推理-样式规律-空间重构-立体拼合
  • 细说蛮力法(一)