当前位置: 首页 > news >正文

使用服务器训练模型的注意事项

一、图像展示

1.1、用VS Code远程连接服务器时,当我们想用matplotlib库来进行图像展示的时候,需要设置DISPLAY变量。

# 用终端工具(XShell)SSH远程服务器,在终端上输入下列语句
# 如果使用了anaconda的虚拟环境,那么需要先进行入虚拟环境中echo $DISPLAY# 输出例子如下:
localhost:10.0# 然后到VS Code的终端里面,注意也是要在虚拟环境中,输入下列语句
export DISPLAY="localhost:10.0"

二、训练模型

2.1、用服务器训练模型时,效果比windows差很多,甚至无法收敛

原因:服务器一般是Linux系统,那么在训练过程中,读取数据集的时候就需要注意:Linux读取文件是乱序的,所以需要加上”sorted“函数,先排序,再遍历数据集。

2.2、模型训练日志保存路径

需要用os库中的一个函数来定义编译器工作路径,设置好了后就可以之间使用”./“来保存文件和读取数据了

import osos.chdir('/home/....../Projects')

2.3、指定GPU训练模型

服务器一般有多卡,那么如果想要指定GPU来训练我们的模型,我们需要设置一个变量,后续的程序中直接使用.cuda()就可以了。

import osos.environ['CUDA_VISIBLE_DEVICES'] = 'gpu_id_0, gpu_id_1'

三、Tensorboard使用

3.1、用服务器训练模型时,tensorboard无法启动 

原因:第一次使用一般都是可以打开的,但一旦在vs code里面关闭它时,其实是没有完全关闭的,所以需要在终端中输入以下指令:

kill -9 $(ps -ef|grep tensorboard|grep -v grep|awk '{print $2}')

 3.2、用服务器训练模型时,tensorboard一直展示上一个项目的训练日志

原因:Tensorboard一直展示前一个项目的数据-CSDN博客

http://www.lryc.cn/news/198011.html

相关文章:

  • Linux性能优化--性能追踪3:系统级迟缓(prelink)
  • SpringBoot2.x简单集成Flowable
  • 微信小程序一键获取位置
  • Linux性能优化--使用性能工具发现问题
  • 【Proteus仿真】【STM32单片机】路灯控制系统
  • Flutter笔记:发布一个Flutter头像模块 easy_avatar
  • 标准化助推开源发展丨九州未来参编开源领域4项团体标准正式发布
  • ChatGPT对于留学生论文写作有哪些帮助?
  • 【yolov8目标检测】使用yolov8训练自己的数据集
  • 【vue+nestjs】gitee第三方授权登录【超详细】
  • node 第八天 使用前后端不分离的方式实现cookie登录验证
  • Ubuntu系统如何进行网络连接-连接电脑局域网-物联网开发-Ubuntu系统维护
  • STL库——Vector常见使用接口
  • 将文件(File 对象)分割成多个块
  • 若要对多态类进行深拷贝,应使用虚函数的clone,而不是公开的拷贝构造赋值
  • 同构字符串(C++解法)
  • 『Linux升级路』基本指令
  • python argparse解析参数
  • 【数据挖掘】数据挖掘、关联分析、分类预测、决策树、聚类、类神经网络与罗吉斯回归
  • nodejs+vue 学生宿舍管理系统设计与实现
  • 汽车R155法规包含那些国家?
  • 一个简易的低代码
  • 【JVM系列】- 类加载子系统与加载过程
  • Amazon图片下载器:利用Scrapy库完成图像下载任务
  • Unity中Shader的Pass的复用
  • vue内容自适应方法
  • RustDay05------Exercise[41-50]
  • C语言实现通讯录(超详细)
  • 【Python机器学习】零基础掌握MinCovDet协方差估计
  • 2023年【四川省安全员A证】模拟试题及四川省安全员A证作业模拟考试