当前位置：首页 > news >正文

探索用卷积神经网络实现MNIST数据集分类

news 2025/8/20 20:07:46

问题
对比单个全连接网络，在卷积神经网络层的加持下，初始时，整个神经网络模型的性能是否会更好。

方法

模型设计
两层卷积神经网络（包含池化层），一层全连接网络。

选择 5 x 5 的卷积核，输入通道为 1，输出通道为 10：
此时图像矩阵经过 5 x 5 的卷积核后会小两圈，也就是4个数位，变成 24 x 24，输出通道为10；
选择 2 x 2 的最大池化层：
此时图像大小缩短一半，变成 12 x 12，通道数不变；
再次经过5 x 5的卷积核，输入通道为 10，输出通道为 20：
此时图像再小两圈，变成 8*8，输出通道为20；
再次经过2 x 2的最大池化层：
此时图像大小缩短一半，变成 4 x 4，通道数不变；
最后将图像整型变换成向量，输入到全连接层中：
输入一共有 4 x 4 x 20 = 320个元素，输出为 10.

代码

准备数据集

# 准备数据集

batch_size = 64

transform = transforms.Compose([

transforms.ToTensor(),

transforms.Normalize((0.1307,), (0.3081,))

])

train_dataset = datasets.MNIST(root='data’,

train=True,

download=True,

transform=transform)

train_loader = DataLoader(train_dataset,

shuffle=True,

batch_size=batch_size)

test_dataset = datasets.MNIST(root='data',

train=False,

download=True,

transform=transform)

test_loader = DataLoader(test_dataset,

shuffle=False,

batch_size=batch_size)

建立模型

class Net(torch.nn.Module):

def __init__(self):

super(Net, self).__init__()

self.conv1 = torch.nn.Conv2d(1, 10, kernel_size=5)

self.conv2 = torch.nn.Conv2d(10, 20, kernel_size=5)

self.pooling = torch.nn.MaxPool2d(2)

self.fc = torch.nn.Linear(320, 10)

def forward(self, x):

batch_size = x.size(0)

x = F.relu(self.pooling(self.conv1(x)))

x = F.relu(self.pooling(self.conv2(x)))

x = x.view(batch_size, -1)

x = self.fc(x)

return x

model = Net()

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

model.to(device)

构造损失函数+优化器

criterion = torch.nn.CrossEntropyLoss()

optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.5)

训练+测试

def train(epoch):

running_loss = 0.0

for batch_idx, data in enumerate(train_loader, 0):

inputs, target = data

inputs,target=inputs.to(device),target.to(device)

optimizer.zero_grad()

outputs = model(inputs)

loss = criterion(outputs, target)

loss.backward()

optimizer.step()

running_loss += loss.item()

if batch_idx % 300 == 299:

print('[%d,%.5d] loss:%.3f' % (epoch + 1, batch_idx + 1, running_loss / 2000))

running_loss = 0.0

def test():

correct=0

total=0

with torch.no_grad():

for data in test_loader:

inputs,target=data

inputs,target=inputs.to(device),target.to(device)

outputs=model(inputs)

_,predicted=torch.max(outputs.data,dim=1)

total+=target.size(0)

correct+=(predicted==target).sum().item()

print('Accuracy on test set:%d %% [%d%d]' %(100*correct/total,correct,total))

if __name__ =='__main__':

for epoch in range(10):

train(epoch)

test()

运行结果

（1）batch_size：64，训练次数：10

（2）batch_size：128，训练次数：10

（3）batch_size：128，训练次数：10

结语

对比单个全连接网络，在卷积神经网络层的加持下，初始时，整个神经网络模型的性能显著提升，准确率最低为96%。在batch_size：64，训练次数：100情况下，准确率达到99%。下一阶在平均池化，3*3卷积核，以及不同通道数的情况下，探索对模型性能的影响。

查看全文

http://www.lryc.cn/news/24279.html

MySQL 索引失效场景

Xcode开发工具，图片放入ios工程

操作系统权限提升(十九)之Linux提权-SUID提权

直播 | StarRocks 实战系列第三期--StarRocks 运维的那些事

KingabseES执行计划-分区剪枝(partition pruning)

Operator-sdk 在 KaiwuDB 容器云中的使用

【数据挖掘】2、数据预处理

（四十六）大白话在数据库里，哪些操作会导致在表级别加锁呢？

【Android源码面试宝典】MMKV从使用到原理分析（二）

如何使用ADFSRelay分析和研究针对ADFS的NTLM中继攻击

【Python学习笔记】第二十二节 Python XML 解析

5分钟轻松拿下Java枚举

华为OD机试【独家】提供C语言题解 - 最小传递延迟

【Web前端】关于JS数组方法的一些理解

多智能体集群协同控制笔记（1）:线性无领航多智能体系统的一致性

hadoop-Yarn资源调度器【尚硅谷】

聊聊如何避免多个jar通过maven打包成一个jar，多个同名配置文件发生覆盖问题

自学5个月Java找到了9K的工作，我的方式值得大家借鉴第二部分

Vue 3 第五章：reactive全家桶

【联机对战】微信小程序联机游戏开发流程详解

优化基于axios接口管理的骚操作

【Django功能开发】如何正确使用定时任务（启动、停止）

7个好用到爆的音频、配乐素材网站，BGM都在这里了

JUC(二)

ATS认证教学

相关文章：