当前位置: 首页 > news >正文

大模型微调概览

文章目录

    • 微调 和 高效微调
    • 高效微调技术方法概述
    • 高效微调方法一:LoRA
    • 高效微调方法二: Prefix Tuning
    • 高效微调方法三: Prompt Tuning
    • 高效微调方法四: P-Tuning v2
    • 基于强化学习的进阶微调方法
      • RLHF 训练流程


微调 和 高效微调

  • 微调,Fine-Tuning, 一般指全参数的微调(全量微调),指是 一类较早诞生的微调方法,全参数微调需要消耗大量的算力,实际使用起来并不方便,因此不久之后又诞生了只围绕部分参数进行微调的高效微调方法;
  • 高效微调,State-of-the -art Parameter- Efficient Fine-Tuning (SOTA PEFT),特指部分参数的微调方法,这种方法算力功耗比更高,也是目前最为常见的微调方法;
  • 除此之外,Fine-Tuning也可 以代指全部微调方法,同时OpenAI中模型微调API的名称也是 Fine-Tuning
    需要注意的是,OpenAl提供的在线微调方法也是一种高效微调方法,并不是全量微调;
http://www.lryc.cn/news/181467.html

相关文章:

  • 利用norm.ppfnorm.interval分别计算正态置信区间[实例]
  • 计算机网络各层设备
  • java this用法
  • 【AI视野·今日NLP 自然语言处理论文速览 第四十六期】Tue, 3 Oct 2023
  • Unity ddx与ddy
  • bootstrap.xml 和applicaiton.properties和applicaiton.yml的区别和联系
  • 基于被囊群优化的BP神经网络(分类应用) - 附代码
  • 我的第一个react.js 的router工程
  • XXPermissions权限请求框架
  • 远程代码执行渗透测试—Server2128
  • 阿里云关系型数据库有哪些?RDS云数据库汇总
  • Linux--socket编程--服务端代码
  • 安装Vue脚手架图文详解教程
  • 宠物医院必备,介绍一款宠物疫苗接种管理软件
  • 哈哈,我保研985了,之后会出一期保研经验分享
  • C++ 程序员入门之路——旅程的起点与挑战
  • C/C++ 数组面试算法题
  • 【pwn入门】用gdb实现第1个pwn
  • 用pyinstaller打包LGBM模型为ELF/EXE可执行文件
  • 软考中级—— 操作系统知识
  • 我们是否真的需要k8s?
  • 基于蜉蝣优化的BP神经网络(分类应用) - 附代码
  • 前端系列-1 HTML+JS+CSS基础
  • Learning Invariant Representation for Unsupervised Image Restoration
  • 1.4.C++项目:仿muduo库实现并发服务器之buffer模块的设计
  • AndroidStudio精品插件集
  • java图书管理系统
  • 大屏自适应容器组件-Vue3+TS
  • java图书信息管理
  • apache服务器出现No input file specified.解决方案