当前位置：首页 > news >正文

【LoRA微调】采用Lora微调时，假设设置的rank值为8，那么在微调时只会调整秩在8以下的矩阵还是只会调整秩等于8的矩阵

news 2025/7/30 12:26:53

在采用 LoRA（Low-Rank Adaptation） 微调时，当设置 rank = r（例如 r=8），实际调整的是两个新引入的小矩阵（维度由 r 决定），而不是直接调整原始权重矩阵中“秩≤8”或“秩=8”的子集。具体原理如下：

LoRA 的核心机制

冻结原始大模型权重
设原始大模型的某一层权重矩阵为 W ∈ R^{d×k}（例如 d=4096, k=4096）。
在微调过程中，W 被冻结（不更新）。
引入低秩分解矩阵
LoRA 会添加两个可训练的小矩阵：
- A ∈ R^{d×r}（例如 d=4096, r=8）
- B ∈ R^{r×k}（例如 r=8, k=4096）
  这两个矩阵的乘积 BA 是一个低秩矩阵（秩≤r），用于近似权重更新量 ΔW。
前向传播公式
修改后的前向计算变为：
```
h = Wx + (BA)x
```
其中：
- Wx：原始冻结权重的输出（固定不变）
- (BA)x：LoRA 引入的增量（可训练部分）

关于 `rank=r` 的调整范围

调整的矩阵：
只优化新增的 A 和 B 矩阵（维度由 r 决定），与原始权重 W 的秩无关。
秩的意义：
r 是 LoRA 的 超参数，控制增量矩阵 ΔW = BA 的 最大秩（即 BA 的秩不超过 r）。
例如 r=8 时，ΔW 的秩 ≤8，但实际秩可能更低（取决于训练结果）。

参数更新对比

方法	可训练参数数量（示例 `d=k=4096`）	调整对象
全参数微调	`4096×4096 ≈ 16.78M`	整个 `W` 矩阵
LoRA (r=8)	`(4096×8) + (8×4096) = 65,536`	仅 `A` 和 `B` 矩阵

更新量仅为全参数微调的 0.39%（65,536 / 16,780,000），大幅节省显存和计算量。

常见误区澄清

❌ 错误理解：
“LoRA 只调整原始权重 W 中秩≤8的子空间。”
✅ 正确解释：
LoRA 完全不调整 W，而是通过低秩矩阵 A 和 B 间接构造增量 ΔW。
❌ 错误理解：
“r=8 表示强制 ΔW 的秩等于8。”
✅ 正确解释：
r=8 是 ΔW 的 最大可能秩（实际秩可能≤8，取决于训练收敛情况）。

为什么低秩更新有效？

根据 内在维度（Intrinsic Dimension） 理论：

大模型在适应下游任务时，权重更新量 ΔW 往往存在于一个低秩子空间中。
即使 r 很小（如8、16），也能有效捕捉任务相关的核心特征。

总结

调整对象：仅新增的 A 和 B 矩阵（维度由 r 和原始权重决定）。
秩的作用：r 控制增量矩阵 ΔW = BA 的最大秩，而非筛选原始权重的子集。
优势：显著降低训练开销，同时保持微调效果接近全参数微调。

通过 LoRA，大模型微调从“调整数十亿参数”简化为“优化几万个小矩阵”，是资源敏感场景的首选方案。

http://www.lryc.cn/news/603966.html

相关文章：

PaaS和SaaS的区别

JVM知识点（1）

自定义View和动画学习记录抓娃娃机View

高端医疗超声AFE模拟前端应用

网络安全运维面试准备

背包进一步（多重背包、混合背包）

jvm冷门知识十讲

Arduino声控RGB矩阵音乐节奏灯DIY全攻略

Nuxt3 全栈作品【通用信息管理系统】菜单管理

比肩 7B 表现！Ovis-U1-3B 集多模态理解、图像生成与编辑于一体

《嵌入式C语言笔记（十五）：字符串操作与多维指针深度解析》

Go进阶：流程控制（if/for/switch）与数组切片

ORACLE的用户维护与权限操作

火山方舟使用豆包基模 —— 基础流程

什么是ios企业签名?

ROUGE-WE：词向量化革新的文本生成评估框架

H.264视频的RTP有效载荷格式（翻译自：RFC6184 第5节 RTP有效载荷格式）

自然语言处理NLP（3）

烟草复杂包装识别准确率↑31%！陌讯多模态SKU检测算法在零售终端的实战解析

CMake 完全实战指南：从入门到精通

MySQL的JDBC编程

Seq2Seq学习笔记

【绘制图像轮廓】——图像预处理（OpenCV）

idea运行tomcat日志乱码问题

CentOS安装ffmpeg并转码视频为mp4

编程算法在金融、医疗、教育、制造业等领域的落地案例

单片机（STM32-WIFI模块）

windows电脑如何截屏 windows电脑截屏教程汇总

【机器学习深度学习】DeepSpeed框架：高效分布式训练的开源利器

Python Flask: Windows 2022 server SMB账户(共享盘账户)密码修改