当前位置：首页 > news >正文

深度学习计算

news 2025/7/15 6:24:23

一、层和块

块可以描述单个层、多个层组成的组件或整个模型。

通过定义块，组装块，可以实现复杂的神经网络。

一个块可以由多个class组成。

其实就是 自己定义神经网络net，自己定义层的顺序和具体的init、 forward函数。

层和块的顺序由sequential处理。

eg：

class MLP( nn . Module): # 这里只要继承了就可以实例化为一个层

# 用模型参数声明层。这里，我们声明两个全连接的层

def __init__(self):

# 调用MLP的父类Module的构造函数来执行必要的参数初始化。 即hidden和out的参数会自动生成。

# 这样，在类实例化时也可以指定其他函数参数，例如模型参数params（稍后将介绍）

super().__init__()

self . hidden = nn.Linear( 20 , 256 ) # 隐藏层

self . out = nn.Linear( 256 , 10 ) # 输出层

# 定义模型的前向传播， 即如何根据输入X返回所需的模型输出

def forward(self, X):

# 注意，这里我们使用ReLU的函数版本，其在nn.functional模块中定义。

return self.out(F.relu(self.hidden(X)))

自己定义网络中的层

一般是在init里定义层，在forward里定义参数的传递 即输出的内容 。

# 手搓一个sequential类

class MySequential(nn.Module):

def __init__(self, *args):

super().__init__()

for idx, module in enumerate(args):

# 这里，module是Module子类的一个实例。我们把它保存在'Module'类的成员

# 变量_modules中。_module的类型是OrderedDict

# _modules的优点是，在模块的参数初始化过程中，系统会在里面查找需要初始化参数的子块。

self._modules[str(idx)] = module

def forward(self, X):

# OrderedDict保证了按照成员添加的顺序遍历它们

for block in self._modules.values():

X = block(X)

return X

net = MySequential (nn.Linear( 20, 256 ), nn.ReLU(), nn.Linear( 256 , 10 ))

为了更强的灵活性，我们想将自己定义的块加入模型中。

class FixedHiddenMLP(nn.Module):

def __init__(self):

super().__init__()

# 不计算梯度的随机权重参数。因此其在训练期间保持不变

self.rand_weight = torch.rand((20, 20), requires_grad=False) # 需要一个常数参数时

self.linear = nn.Linear(20, 20)

def forward(self, X):

X = self.linear(X)

# 使用创建的常量参数以及relu和mm函数

X = F.relu(torch.mm(X, self.rand_weight) + 1)

# 复用全连接层。这相当于两个全连接层共享参数

X = self.linear(X)

class NestMLP(nn.Module):

def __init__(self):

super().__init__()

self.net = nn.Sequential(nn.Linear(20, 64), nn.ReLU(),

nn.Linear(64, 32), nn.ReLU())

self.linear = nn.Linear(32, 16)

def forward(self, X):

return self.linear(self.net(X)) #骚操作

chimera = nn.Sequential(NestMLP(), nn.Linear(16, 20), FixedHiddenMLP())

二、保存模型参数

torch. save( net .state_dict(), 'mlp.params') #保存参数

clone = MLP()

clone.load_state_dict(torch.load('mlp.params')) #复用参数

clone.eval()

查看全文

http://www.lryc.cn/news/442519.html

Hexo博客私有部署Twikoo评论系统并迁移评论记录(自定义邮件回复模板)

Vue.js 与 Flask/Django 后端配合：构建现代 Web 应用的最佳实践

【笔记】自动驾驶预测与决策规划_Part3_路径与轨迹规划

Shiro-721—漏洞分析(CVE-2019-12422)

音视频入门基础：AAC专题（4）——ADTS格式的AAC裸流实例分析

【第33章】Spring Cloud之SkyWalking服务链路追踪

如何选择OS--Linux不同Distribution的选用

cesium效果不酷炫怎么办--增加渲染器

计算机网络：概述 --- 体系结构

DEPLOT: One-shot visual language reasoning by plot-to-table translation论文阅读

从 HDFS 迁移到 MinIO 企业对象存储

Rust 常见问题汇总

java泛型类与泛型方法

Android String资源文件中，空格、换行以及特殊字符如何表示

CUDA及GPU学习资源汇总

uniapp vue3 梯形选项卡组件

如何在微信小程序中实现WebSocket连接

二级等保测评中安全物理环境的重要性及高危项分析

相关文章：