当前位置: 首页 > news >正文

深度学习-模型调试经验总结

1、
在这里插入图片描述这句话的意思是:期望张量的后端处理是在cpu上,但是实际是在cuda上。排查代码发现,数据还在cpu上,但是模型已经转到cuda上,所以可以通过把数据转到cuda上解决。
解决代码:

tensor.to("cuda")

2、
在这里插入图片描述解决方法:减小batch size的大小或减小图片的尺寸
3、

在这里插入图片描述原始的代码如下:

torch.save(model.module.state_dict(), os.path.join(model_prefix, '{}-model.pth'.format(epoch)))

原因:因为只有一块GPU,以上代码是多GPU使用的
解决方法:改为以下单GPU代码:

        meta = {}checkpoint = {"meta": meta, "state_dict": weights_to_cpu(model.state_dict())}if optimizer is not None:checkpoint["optimizer"] = optimizer.state_dict()torch.save(checkpoint, os.path.join(model_prefix, '{}-model.pth'.format(epoch)))
http://www.lryc.cn/news/248624.html

相关文章:

  • Redis打包事务,分批提交
  • 深度学习毕设项目 深度学习 python opencv 动物识别与检测
  • leetcode 611. 有效三角形的个数(优质解法)
  • Ubuntu使用Nginx部署前端项目——记录
  • 小航助学题库蓝桥杯题库c++选拔赛(22年1月)(含题库教师学生账号)
  • centos用户相关命令
  • 智能优化算法应用:基于哈里斯鹰算法无线传感器网络(WSN)覆盖优化 - 附代码
  • Stability AI 新发布SDXL Turbo:一款实时文本到图像生成模型
  • 基于Java SSM框架+Vue实现病人跟踪治疗信息系统项目【项目源码+论文说明】
  • js一行压缩库
  • 管理库存和出货的软件
  • 保护关键信息基础设施网络安全,SSL证书来助力
  • Python实现学生信息管理系统(详解版)
  • 企业计算机服务器中了mallox勒索病毒如何解密,mallox勒索病毒文件恢复
  • Linux学习笔记 CenOS6.3 yum No package xxx available
  • 【探索Linux】—— 强大的命令行工具 P.18(进程信号 —— 信号捕捉 | 信号处理 | sigaction() )
  • vue3+ts v-model 深度学习
  • 网络通信概述
  • <avue-crud/>,二级表头,children下字典项的dicUrl失效问题
  • FastApi接收不到Apifox发送的from-data字符串_解决方法
  • Python高级数据结构——堆(Heap)
  • linux 讨论题合集(个人复习)
  • 浅析SD-WAN技术如何加强企业网络安全
  • 测试相关-面试高频
  • 基于Java web的多功能游戏大厅系统的开发与实现
  • 【MySQL工具】my2sql-快速解析binlog
  • vueRouter常用属性
  • Qt5.15.2的镜像网址
  • Python隐藏特性:字符串驻留、常量折叠
  • 2-Python与设计模式--工厂类相关模式