当前位置: 首页 > news >正文

ubuntu 系统风扇控制软件 CoolerControl

背景

A6000显卡的温度一直都是86度左右,GPU的风扇转速不够大。
我首先把 nvidia的驱动更新了,但是发现风扇依然依然保持在较低的转速。
后面无意间搜到了CoolerControl 这个linux平台的风扇控制软件。设置之后,增加了风扇的转速,现在可以把GPU的温度控制在80度以下。

具体操作

参考教程:https://cn.linux-terminal.com/?p=8335

支持风扇固定转速与按照曲线设置转速。

下述图片是按照这个曲线控制风扇的转速,达到不同的温度,风扇保持不同的转速。不仅可以控制CPU的风扇还可以控制GPU的风扇。

CoolerControl 视频教程:https://www.bilibili.com/video/BV1oF9yYFEvc/
我发现B站和youtube关于CoolerControl软件的教程,其中主要也就是设置下面的曲线。

在这里插入图片描述

题外话

A6000显卡温度在85度以上,我早就注意到了,不想折腾,一直都懒得管。我发现在训练模型的时候,windows把GPU的温度压的比较好,一直都70度以下。Windows训练大模型不方便,还是得使用 linux 训练大模型。

我很多次使用 llamafactory 微调大模型的时候,模型训练一半linux系统就崩溃了,必须得按关机键重启。
首先,我便怀疑是不是显卡温度过高触发了硬件的保护机制,导致系统崩溃。后面我发现把GPU的温度压下来后,训练大模型依然会崩溃。
因为nvidia的驱动已经更新过了,不是驱动的问题。于是我把python环境从3.11升级到3.12,再把 llamafactory 的包重新安装了一遍,在装包的过程中,我发现安装了很多与nvidia相关的包。然后再训练大模型就不崩溃了。

http://www.lryc.cn/news/608007.html

相关文章:

  • 关于项目发布中到后半夜的一些总结
  • Maven - 并行安全无重复打包构建原理揭秘
  • 公网服务器上Nginx或者Openresty如何屏蔽IP直接扫描
  • 译|Netflix 技术博客:一个利用视觉-语言模型和主动学习高效构建视频分类器的框架
  • 初始C语言---第四讲(数组)
  • Python So Easy 大虫小呓三部曲 - 高阶篇
  • 【语音技术】什么是实体
  • appium中urllib3.exceptions.LocationValueError: No host specified. 的错误解决办法
  • cv快速input
  • InfluxDB 与 Node.js 框架:Express 集成方案(二)
  • SpringBoot与TurboGears2跨栈、整合AI服务、智能客服路由系统整合实战
  • 基于Redis自动过期的流处理暂停机制
  • dbt中多源数据的处理
  • 仿真电路:(十七下)DC-DC升压压电路原理简单仿真
  • Git下载及安装保姆级教程
  • 电子电气架构 --- 汽车网络安全概述
  • 深入 Go 底层原理(九):context 包的设计哲学与实现
  • 八股取士-go
  • python爬取豆瓣电影评论通用代码
  • Getedit-得辑SCI论文润色的重要性?
  • 自动驾驶:技术、应用与未来展望——从开创到全面革新交通出行
  • 【Linux系统】详解,进程控制
  • mongo,mongod,mongos指令
  • 【Linux】vim—基操
  • hcip---ospf知识点总结及实验配置
  • 剧本杀小程序系统开发:构建数字化剧本杀生态圈
  • rosdep的作用以及rosdep install时的常用参数
  • [论文阅读] 人工智能 + 软件工程 | GitHub Marketplace中CI Actions的功能冗余与演化规律研究
  • DDD Repository模式权威指南:从理论到Java实践
  • 网络基础实操篇-05-路由基础-最佳实践