当前位置：首页 > news >正文

迁移学习中模型训练加速（以mllm模型为例），提速15%以上

news 2025/6/27 15:46:21

根据模型训练过程的显存占用实测的分析，一个1g参数的模型（存储占用4g）训练大约需要20g的显存，其中梯度值占用的显存约一半。博主本意是想实现在迁移学习（冻结部分参数）中模型显存占用的降低，结果不太满意，只能实现训练速度提升，但无法实现显存占用优化。预计是在现有的训练框架中，对于显存占用优化做的十分到位，优化空间极小。但基于现有的策略，在不影响任何训练效果下，侥幸能实现训练速度提升15%也是十分有意义的。这里以ms-swift框架为例，训练模型以Florence-2-large-ft（提速30%）与Qwen2-VL-2B-Instruct（提速16%）模型为例。只需要使用model=MyModel(model)替换一下原有模型即可。

1、核心修改

1.1 关键代码

将以下代码保存到 swift\llm 目录下，文件名为 MyModel.py


from torch import<

http://www.lryc.cn/news/503434.html

相关文章：

socket编程UDP-实现停等机制（接收确认、超时重传）

前端面试题目 (Node.JS-Express框架)[二]

防范TCP攻击：策略与实践

3D 生成重建034-NerfDiff借助扩散模型直接生成nerf

分布式 Paxos算法总结

我的宝贵经验

geoserver 瓦片地图，tomcat和nginx实现负载均衡

Jenkins 启动程序退出后被杀死问题

SEGGER | 基于STM32F405 + Keil - RTT组件01 - 移植SEGGER RTT

分布式开发学习

freeswitch(开启支持MCU视频会议,使用mod_av模块)

Vue3常见api使用指南（TS版）

分布式分布式事务总结

onnx文件转pytorch pt模型文件

智能座舱人机交互升级

RabbitMQ中点对点（Point-to-Point）通讯方式的Java实现

爬虫实战：获取1688接口数据全攻略

生成树协议STP工作步骤

Android14 AOSP支持短按关机

C# 和 go 关于can通信得整理

vue常用命令汇总

【C++习题】18.逆波兰表达式求值

本地如何使用 yarn link 调试本地 npm 包

江恩45年一书的自己一点读书见解

影响 Linux、Unix 系统的 CUPS 漏洞可导致 RCE

【汇编】思考汇编中的两个基本问题

Nest Dynamic modules 笔记

生成式AI、大模型、多模态技术开发与应用学习清单

STM32 CubeMx HAL库独立看门狗IWDG配置使用

网络安全渗透测试概论