当前位置: 首页 > news >正文

Pytorch模型参数的保存和加载

目录

一、前言

二、参数保存

三、参数的加载

四、保存和加载整个模型

五、总结


一、前言

在模型训练完成后,我们需要保存模型参数值用于后续的测试过程。由于保存整个模型将耗费大量的存储,故推荐的做法是只保存参数,使用时只需在建好模型的基础上加载。

通常来说,保存的对象包括网络参数值、优化器参数值、epoch值等。本文将简单介绍保存和加载模型参数的方法,同时也给出保存整个模型的方法供大家参考。

二、参数保存

在这里我们使用 torch.save() 函数保存模型参数:

import torch
path = './model.pth'
torch.save(model.state_dict(), path)

model——指定义的模型实例变量,如model=net( )

state_dict()——state_dict( )是一个可以轻松地保存、更新、修改和恢复的python字典对象, 对于model来说,表示模型的每一层的权重及偏置等参数信息;对于 optimizer 来说,其包含了优化器的状态以及被使用的超参数(如lr, momentum,weight_decay等)

path——path是保存参数的路径,一般设置为 path='./model.pth' , path='./model.pkl'等形式。

此外,如果想保存某一次训练采用的optimizer、epochs等信息,可将这些信息组合起来构成一个字典保存起来:

import torch
path = './model.pth'
state = {'model': model.state_dict(), 'optimizer': optimizer.state_dict(), 'epoch': epoch}
torch.save(state, path)

三、参数的加载

使用 load_state_dict()函数加载参数到模型中, 当仅保存了模型参数,而没有optimizer、epochs等信息时:

model.load_state_dict(torch.load(path))

model——事先定义好的跟原模型一致的模型

path——之前保存的模型参数文件

如若保存了optimizer、epochs等信息,我们这样载入信息:

# 使用torch.load()函数将文件中字典信息载入 state_dict 变量中
state_dict = torch.load(path)
# 分布加载参数到模型和优化器
model.load_state_dict(state_dict['model'])
optimizer.load_state_dict(state_dict['optimizer'])
epoch = state_dict(['epoch'])

我们还可以在每n个epoch后保存一次参数,以观察不同迭代次数模型的表现此时我们可设置不同的path,如 path='./model' + str(epoch) +'.pth',这样,不同epoch的参数就能保存在不同的文件中。

四、保存和加载整个模型

使用上文提到的方法即可:

torch.save(model, path)
model = torch.load(path)

五、总结

pytorch中state_dict()和load_state_dict()函数配合使用可以实现状态的获取与重载,load()和save()函数配合使用可以实现参数的存储与读取。掌握对应的函数使用方法就可以游刃有余地进行运用。

http://www.lryc.cn/news/37265.html

相关文章:

  • 面试热点题:回溯算法之组合 组合与组合总和 III
  • java面试-jvm
  • vscode下载与使用
  • 人员摔倒识别预警算法 opencv
  • 华为OD机试题 - 火星文计算(JavaScript)| 机考必刷
  • AI人工智能 - 初探
  • Spring-AOP工作流程
  • C51---串口发送指令,控制LED灯亮灭
  • 【Wiki】XWiki数据备份
  • ctk框架开发Qt插件应用示例工程
  • spring5源码篇(4)——beanFactoryPostProcessor执行/注解bean的装配
  • masstransit的message几个高级用法
  • 漏洞分析丨cve-2012-0003
  • rm命令——删除文件或目录
  • 【零基础入门学习Python---Python的基本语法使用】
  • 数据仓库相关概念的解释
  • 1/4车、1/2车、整车悬架模糊PID控制仿真合集
  • Linux性能补丁升级,避免不必要的跨核Wake-Up
  • Spring Cloud Alibaba全家桶(六)——微服务组件Sentinel介绍与使用
  • 拼多多2021笔试真题集 -- 3. 多多的求和计算
  • DP算法:动态规划算法
  • 一三四——一六七
  • day29_JS
  • 【HTTP协议与Web服务器】
  • Idea+maven+spring-cloud项目搭建系列--12 整合grpc
  • Revit开洞问题:结构专业开洞口剖面显示及一键开洞
  • 0107连通分量-无向图-数据结构和算法(Java)
  • [学习笔记]黑马程序员python教程
  • 如何配置用于构建 FastReport Online Designer 的 API ?
  • 【嵌入式Linux内核驱动】02_字符设备驱动