当前位置: 首页 > news >正文

迁移学习中模型训练加速(以mllm模型为例),提速15%以上

根据模型训练过程的显存占用实测的分析,一个1g参数的模型(存储占用4g)训练大约需要20g的显存,其中梯度值占用的显存约一半。博主本意是想实现在迁移学习(冻结部分参数)中模型显存占用的降低,结果不太满意,只能实现训练速度提升,但无法实现显存占用优化。预计是在现有的训练框架中,对于显存占用优化做的十分到位,优化空间极小。但基于现有的策略,在不影响任何训练效果下,侥幸能实现训练速度提升15%也是十分有意义的。 这里以ms-swift框架为例,训练模型以Florence-2-large-ft(提速30%)与Qwen2-VL-2B-Instruct(提速16%)模型为例。只需要使用model=MyModel(model)替换一下原有模型即可。

1、核心修改

1.1 关键代码

将以下代码保存到 swift\llm 目录下,文件名为 MyModel.py


from torch import<
http://www.lryc.cn/news/503434.html

相关文章:

  • socket编程UDP-实现停等机制(接收确认、超时重传)
  • 前端面试题目 (Node.JS-Express框架)[二]
  • 防范TCP攻击:策略与实践
  • 3D 生成重建034-NerfDiff借助扩散模型直接生成nerf
  • 分布式 Paxos算法 总结
  • 我的宝贵经验
  • geoserver 瓦片地图,tomcat和nginx实现负载均衡
  • Jenkins 启动 程序 退出后 被杀死问题
  • SEGGER | 基于STM32F405 + Keil - RTT组件01 - 移植SEGGER RTT
  • 分布式开发学习
  • freeswitch(开启支持MCU视频会议,使用mod_av模块)
  • Vue3常见api使用指南(TS版)
  • 分布式 分布式事务 总结
  • onnx文件转pytorch pt模型文件
  • 智能座舱人机交互升级
  • RabbitMQ中点对点(Point-to-Point)通讯方式的Java实现
  • 爬虫实战:获取1688接口数据全攻略
  • 生成树协议STP工作步骤
  • Android14 AOSP支持短按关机
  • C# 和 go 关于can通信得 整理
  • vue常用命令汇总
  • 【C++习题】18.逆波兰表达式求值
  • 本地如何使用 yarn link 调试本地 npm 包
  • 江恩45年一书的自己一点读书见解
  • 影响 Linux、Unix 系统的 CUPS 漏洞可导致 RCE
  • 【汇编】思考汇编中的两个基本问题
  • Nest Dynamic modules 笔记
  • 生成式AI、大模型、多模态技术开发与应用学习清单
  • STM32 CubeMx HAL库 独立看门狗IWDG配置使用
  • 网络安全渗透测试概论