当前位置: 首页 > news >正文

概念解析 | LoRA:低秩矩阵分解在神经网络微调中的魔力

注1:本文系“概念解析”系列之一,致力于简洁清晰地解释、辨析复杂而专业的概念。本次辨析的概念是:基于低秩矩阵分解的神经网络微调方法LoRA

LoRA:低秩矩阵分解在神经网络微调中的魔力 Low-Rank Adaptation of Large Language Models

LoRA由如下论文提出,详细信息请参见论文原文
https://arxiv.org/abs/2106.09685

@inproceedings{
hu2022lora,
title={Lo{RA}: Low-Rank Adaptation of Large Language Models},
author={Edward J Hu and Yelong Shen and Phillip Wallis and Zeyuan Allen-Zhu and Yuanzhi Li and Shean Wang and Lu Wang and Weizhu Chen},
booktitle={International Conference on Learning Representations},
year={2022},
url={https://openreview.net/forum?id=nZeVKeeFYf9}
}

背景介绍

在自然语言处理中,预训练语言模型通常需要在大规模通用域数据集上进行预训练,然后再在特定的下游任务上进行微调。随着预训练模型规模的不断扩大,对全模型进行微调变得越来越困难。例如GPT-3拥有1750亿个参数,独立部署多个针对不同任务微调的模型成本过高

http://www.lryc.cn/news/228913.html

相关文章:

  • 量子计算和量子通信技术:引领潜力无限的未来
  • nodejs+vue+python+PHP+微信小程序-安卓- 电影在线订票系统的设计与实现-计算机毕业设计推荐
  • LightDB23.4支持mysql aes_encrypt/aes_decrypt/hex/unhex函数
  • uniapp——项目day04
  • 7-爬虫-中间件和下载中间件(加代理,加请求头,加cookie)、scrapy集成selenium、源码去重规则(布隆过滤器)、分布式爬虫
  • 创建自己的nas服务,从远端拉取所需文件
  • 智慧化城市内涝的预警,万宾科技内涝积水监测仪
  • 7-18 调用一个函数
  • VB.net TCP服务端监听端口接收客户端RFID网络读卡器上传的读卡数据
  • Springboot 集成 MongoDB
  • AM@定积分的定义求某些类型的极限
  • Perl爬虫程序的框架
  • 15. 机器学习——聚类
  • 华为笔记本电脑原装win10/win11系统恢复安装教程方法
  • 计算机毕业设计 基于SpringBoot的养老院管理系统的设计与实现 Java实战项目 附源码+文档+视频讲解
  • Python数据容器(序列操作)
  • 【C++】stack,queue和deque
  • Linux centos系统中添加磁盘
  • java网络编程之UDP协议
  • 几百封钓鱼邮件如何分析?一个简单的方法告诉你!
  • 【设计原则篇】聊聊开闭原则
  • LVS面试题
  • uniapp发行web页面在老版本浏览器打开一片空白
  • 数据结构—二叉树的模拟实现(c语言)
  • COCO数据集下载
  • 基于安卓android微信小程序的校园互助平台
  • Spring整合Junit(4、5)
  • Linux 程序开发流程 / 基本开发工具 / Vim / GCC工具链 / Make 工具 / Makefile 模板
  • 2023.11.13【读书笔记】丨生物信息学与功能基因组学(第六章 多重序列比对 下)
  • 【vue】虚拟dom的原理是什么?手写实现虚拟dom !