当前位置: 首页 > news >正文

神经网络-LeNet

 LeNet在1990年被提出,是一系列网络的统称,包括了LeNet1~LeNet5,对于神经网络的学习者来说,大家对下面这个图一定很熟悉,该图是对LeNet的简化展示。

 

在LeNet中已经提出了卷积层、Pooling层等概念,只是但是由于缺乏大量数据和计算机硬件资源限制,导致LeNet的表现并不理想。

LeNet网络结构

LeNet的构成很简单,包括了基础的卷积层、池化层和全连接层,原始的LeNet使用的是灰度图像,下面示例中使用彩色图像进行说明,不影响网络的理解。

  • 定义网络层

# 定义网络
class LeNet(nn.Module):                    #继承来着nn.Module的父类def __init__(self):  # 初始化网络#super()继承父类的构造函数,多继承需用到super函数super(LeNet, self).__init__()# 定义卷积层,[深度,卷积核数,卷积核大小]self.conv1 = nn.Conv2d(3, 16, 5)# 最大池化,[核大小,步长]self.pool1 = nn.MaxPool2d(2, 2)self.conv2 = nn.Conv2d(16, 32, 5)self.pool2 = nn.MaxPool2d(2, 2)# 全连接层self.fc1 = nn.Linear(32*5*5, 120)self.fc2 = nn.Linear(120, 84)# 根据训练项目,调整类别数self.fc3 = nn.Linear(84, 10)#图像参数变化def forward(self, x):            # input(3, 32, 32)        x = F.relu(self.conv1(x))    #output(16, 28, 28)x = self.pool1(x)            # output(16, 14, 14)x = F.relu(self.conv2(x))    # output(32, 10, 10)x = self.pool2(x)            # output(32, 5, 5)x = x.view(-1, 32*5*5)       # output(32*5*5)x = F.relu(self.fc1(x))      # output(120)x = F.relu(self.fc2(x))      # output(84)x = self.fc3(x)              # output(10)return x

网络结构如下,下面将对每一层做一个介绍:

 网络中feature map的变化大致如下:

 

LeNet实例应用

  • 数据预处理

# 对数据进行预处理
transform = transforms.Compose([# 将输入的 numpy.ndarry[h*w*c]转变为[c*h*w],像素点值从[0,255],标准化为[0,1]transforms.ToTensor(),# 将数据进行标注化transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))]
)
  • 数据读取

如果是初次使用CIFAR,需要将download打开,也可以自行通过其他方式进行下载。

# 读取数据-训练集
train_set = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)
train_loader = torch.utils.data.DataLoader(train_set, batch_size=36, shuffle=False, num_workers=0)
  • 定义网络

通过LeNet中的介绍,完成网络的定义。

  • 定义损失函数和优化器

pytorch支持很多损失函数和优化器,可以根据需要进行设定

# 定义损失函数
loss_function = nn.CrossEntropyLoss()# 定义优化器
optimizer = optim.Adam(net.parameters(), lr=0.001)
  • 模型训练

# 开始训练,设置迭代轮次 epoch
for epoch in range(3):# 损失函数值running_loss = 0.0for step, data in enumerate(train_loader, start=0):inputs, labels = data# 清除梯度累加值optimizer.zero_grad()outputs = net(inputs.to(device))# 计算损失值loss = loss_function(outputs, labels.to(device))# 计算梯度loss.backward()# 参数更新optimizer.step()# 输出损失值running_loss += loss.item()if step % 500 == 499:with torch.no_grad():outputs = net(val_image.to(device))# 输出最大概率predict_y = torch.max(outputs, dim=1)[1]accuracy = (predict_y == val_label.to(device)).sum().item() / val_label.size(0)print('[%d, %5d] train_Loss:%.3f tese_accuracy: %.3f' % (epoch + 1, step + 1, running_loss/500, accuracy))running_loss = 0.0print('train finished')
  • 保存模型

# 保存模型
save_path = './Lenet.pth'
torch.save(net.state_dict(), save_path)

补充

  • Pytorch中tensor的顺序是:[batch, channel, height, width]

  • 卷积层中计算输出大小

 

  • W表示输入图像的Weight,一般Weight=hight

  • F表示核的大小,核大小一般为F * F

  • P表示Padding,Conv2d中默认是0

  • S表示步长

因此对于32*32的输入,在该网络中Output=(32-5+2*0)/1 +1 = 28

  • 池化层只改变特征的高和宽,不改变深度

因此对于16*28*28,经过MaxPooling后变成了16*14*14

http://www.lryc.cn/news/508764.html

相关文章:

  • es 中 terms set 使用
  • 绩效考核试题
  • 停车管理系统:构建安全、便捷的停车环境
  • 十四、从0开始卷出一个新项目之瑞萨RZN2L之栈回溯(Default_Handler/hartfault)
  • 联通光猫怎么自己改桥接模式?
  • 突围边缘:OpenAI开源实时嵌入式API,AI触角延伸至微观世界
  • springBoot Maven 剔除无用的jar引用
  • malloc 分配大堆块(128KB)的一次探索
  • Android -- 双屏异显之方法二
  • 电脑使用CDR时弹出错误“计算机丢失mfc140u.dll”是什么原因?“计算机丢失mfc140u.dll”要怎么解决?
  • 使用RDMA技术构建无损网络
  • vscode 识别git目录
  • OpenCV相机标定与3D重建(26)计算两个二维点集之间的部分仿射变换矩阵(2x3)函数 estimateAffinePartial2D()的使用
  • StarRocks 生产部署一套集群,存储空间如何规划?
  • JVM执行引擎JIT深度剖析
  • 【DOCKER】基于DOCKER的服务之DUFS
  • 加密货币地址的基本概念
  • 如何在 Linux 服务器上部署 Pydio Cells 教程
  • Halcon例程代码解读:安全环检测(附源码|图像下载链接)
  • Selenium 全面指南
  • #error: WinSock.h has already been included解决方案
  • 2.Couchbase 的增量查询优化
  • 汽车IVI中控开发入门及进阶(46):FFmpeg
  • Spring Boot 中的 @Scheduled 定时任务以及开关控制
  • 服务器证书原理
  • 重温设计模式--代理、中介者、适配器模式的异同
  • 2024第十六届蓝桥杯模拟赛(第二期)-Python
  • 分布式系统中的防抖策略一致性与性能优化
  • 项目代码第6讲:UpdownController.cs;理解 工艺/工序 流程、机台信息;前端的“历史 警报/工艺 记录”
  • 【计算机视觉基础CV-图像分类】03-深度学习图像分类实战:鲜花数据集加载与预处理详解