当前位置: 首页 > news >正文

ChatGLM DeepSpeed/P-Tuning v2 调参

之前尝试了基于ChatGLM-6B使用LoRA进行参数高效微调,本文给大家分享使用DeepSpeed和P-Tuning v2对ChatGLM-6B进行微调,相关代码放置在GitHub上面:llm-action

ChatGLM-6B简介

ChatGLM-6B相关的简介请查看之前的文章,这里不再赘述。

P-Tuning v2简介

P-Tuning是一种较新的模型微调方法,它采用了参数剪枝的技术,可以将微调的参数量减少到原来的0.1%。具体来说,P-Tuning v2是基于P-Tuning v1的升级版,主要的改进在于采用了更加高效的剪枝方法,可以进一步减少模型微调的参数量。

P-Tuning v2的原理是通过对已训练好的大型语言模型进行参数剪枝,得到一个更加小巧、效率更高的轻量级模型。具体地,P-Tuning v2首先使用一种自适应的剪枝策略,对大型语言模型中的参数进行裁剪,去除其中不必要的冗余参数。然后,对于被剪枝的参数,P-Tuning v2使用了一种特殊的压缩方法,能够更加有效地压缩参数大小,并显著减少模型微调的总参数量。

总的来说,P-Tuning v2的核心思想是让模型变得更加轻便、更加高效,同时尽可能地保持模型的性能不受影响。这不仅可以加快模型的训练和推理速度,还可以减少模型在使用过程中的内存和计算资

http://www.lryc.cn/news/170418.html

相关文章:

  • Leetcode每日一题:打家劫舍系列Ⅰ、Ⅱ、Ⅲ、Ⅳ(2023.9.16~2023.9.19 C++)
  • 容易对一个异性产生依赖感怎么办?
  • Windows10/11无线网卡WIFI驱动详细下载安装教程
  • 面向面试知识--Lottery项目
  • SpringBoot接口中如何直接返回图片数据
  • c语言进阶部分详解(指针进阶1)
  • 计算机竞赛 大数据商城人流数据分析与可视化 - python 大数据分析
  • 各种电机驱动原理
  • 人脸图像数据增强
  • Android 查看按键信息的常用命令详解
  • 【Java 基础篇】Properties 结合集合类的使用详解
  • 数字孪生体标准编程
  • 力扣 -- 394. 字符串解码
  • 面试官:什么是虚拟DOM?如何实现一个虚拟DOM?说说你的思路
  • Ubuntu安装中文拼音输入法
  • 高端知识竞赛中用到的软件和硬件有哪些
  • Vue 3.3 发布
  • 算法|图论 3
  • 【数据结构】二叉树的层序遍历(四)
  • macOS文件差异比较最佳工具:Beyond Compare 4
  • Windows+Pycharm 如何创建虚拟环境
  • vant 按需导入 vue2
  • Java手写分治算法和分治算法应用拓展案例
  • 学习 CodeWhisperer 的一些总结
  • JavaScript 中的 `this` 指向问题与其在加密中的应用
  • 深入理解算法的时间复杂度
  • 2023年度教育部人文社会科学研究一般项目评审结果,已公布!
  • 十一、MySql的事务(上)
  • 时间序列分析1--生成和导出时间序列数据
  • HarmonyOS应用开发—资源分类与访问