当前位置: 首页 > news >正文

【LoRA微调】采用Lora微调时,假设设置的rank值为8,那么在微调时只会调整秩在8以下的矩阵还是只会调整秩等于8的矩阵

在采用 LoRA(Low-Rank Adaptation) 微调时,当设置 rank = r(例如 r=8),实际调整的是两个新引入的小矩阵(维度由 r 决定),而不是直接调整原始权重矩阵中“秩≤8”或“秩=8”的子集。具体原理如下:


LoRA 的核心机制

  1. 冻结原始大模型权重
    设原始大模型的某一层权重矩阵为 W ∈ R^{d×k}(例如 d=4096, k=4096)。
    在微调过程中,W 被冻结(不更新)

  2. 引入低秩分解矩阵
    LoRA 会添加两个可训练的小矩阵:

    • A ∈ R^{d×r}(例如 d=4096, r=8
    • B ∈ R^{r×k}(例如 r=8, k=4096
      这两个矩阵的乘积 BA 是一个低秩矩阵(秩≤r),用于近似权重更新量 ΔW
  3. 前向传播公式
    修改后的前向计算变为:

    h = Wx + (BA)x
    

    其中:

    • Wx:原始冻结权重的输出(固定不变)
    • (BA)x:LoRA 引入的增量(可训练部分)

关于 rank=r 的调整范围

  • 调整的矩阵
    只优化新增的 AB 矩阵(维度由 r 决定),与原始权重 W 的秩无关
  • 秩的意义
    r 是 LoRA 的 超参数,控制增量矩阵 ΔW = BA最大秩(即 BA 的秩不超过 r)。
    例如 r=8 时,ΔW 的秩 ≤8,但实际秩可能更低(取决于训练结果)。

参数更新对比

方法可训练参数数量(示例 d=k=4096调整对象
全参数微调4096×4096 ≈ 16.78M整个 W 矩阵
LoRA (r=8)(4096×8) + (8×4096) = 65,536AB 矩阵

更新量仅为全参数微调的 0.39%(65,536 / 16,780,000),大幅节省显存和计算量。


常见误区澄清

  1. 错误理解
    “LoRA 只调整原始权重 W 中秩≤8的子空间。”
    ✅ 正确解释
    LoRA 完全不调整 W,而是通过低秩矩阵 AB 间接构造增量 ΔW

  2. 错误理解
    r=8 表示强制 ΔW 的秩等于8。”
    ✅ 正确解释
    r=8ΔW最大可能秩(实际秩可能≤8,取决于训练收敛情况)。


为什么低秩更新有效?

根据 内在维度(Intrinsic Dimension) 理论:

大模型在适应下游任务时,权重更新量 ΔW 往往存在于一个低秩子空间中。
即使 r 很小(如8、16),也能有效捕捉任务相关的核心特征。


总结

  • 调整对象:仅新增的 AB 矩阵(维度由 r 和原始权重决定)。
  • 秩的作用r 控制增量矩阵 ΔW = BA 的最大秩,而非筛选原始权重的子集。
  • 优势:显著降低训练开销,同时保持微调效果接近全参数微调。

通过 LoRA,大模型微调从“调整数十亿参数”简化为“优化几万个小矩阵”,是资源敏感场景的首选方案。

http://www.lryc.cn/news/603966.html

相关文章:

  • PaaS和SaaS的区别
  • JVM知识点(1)
  • 自定义View和动画学习记录 抓娃娃机View
  • 高端医疗超声AFE模拟前端应用
  • 网络安全运维面试准备
  • 背包进一步(多重背包、混合背包)
  • jvm冷门知识十讲
  • Arduino声控RGB矩阵音乐节奏灯DIY全攻略
  • Nuxt3 全栈作品【通用信息管理系统】菜单管理
  • 比肩 7B 表现!Ovis-U1-3B 集多模态理解、图像生成与编辑于一体
  • 《嵌入式C语言笔记(十五):字符串操作与多维指针深度解析》
  • Go进阶:流程控制(if/for/switch)与数组切片
  • ORACLE的用户维护与权限操作
  • 火山方舟使用豆包基模 —— 基础流程
  • 什么是ios企业签名?
  • ROUGE-WE:词向量化革新的文本生成评估框架
  • H.264视频的RTP有效载荷格式(翻译自:RFC6184 第5节 RTP有效载荷格式)
  • 自然语言处理NLP(3)
  • 烟草复杂包装识别准确率↑31%!陌讯多模态SKU检测算法在零售终端的实战解析
  • CMake 完全实战指南:从入门到精通
  • MySQL的JDBC编程
  • Seq2Seq学习笔记
  • 【绘制图像轮廓】——图像预处理(OpenCV)
  • idea运行tomcat日志乱码问题
  • CentOS安装ffmpeg并转码视频为mp4
  • 编程算法在金融、医疗、教育、制造业等领域的落地案例
  • 单片机(STM32-WIFI模块)
  • windows电脑如何截屏 windows电脑截屏教程汇总
  • 【机器学习深度学习】DeepSpeed框架:高效分布式训练的开源利器
  • Python Flask: Windows 2022 server SMB账户(共享盘账户)密码修改