当前位置: 首页 > news >正文

基于deepseek的LORA微调

LORA微调:

核心是:低秩转换,减少参数。冻结大部分,调节部分模块(注意力模块的Wq,Wk,Wv)。

调整过后得到一个lora.safetensors, 内部记录了(detail W: 即部分修改的W)。推理使用原权重和lora权重。

具体操作:
1,先进行工具,与库的下载

source /etc/network_turbo #先设置镜像 git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git # 下载工具库代码 cd LLaMA-Factory # 进入文件夹 pip install -e ".[torch,metrics]" # 下载环境 llamafactory-cli version #查看版本安装成功会有对应的版本

2,LLaMA-Factory运行网页管理页面

export GRADIO_SERVER_PORT=6006 # 设置临时端口 echo $GRADIO_SERVER_PORT # 查看是否设置成功 llamafactory-cli webui # 设置成功可以开启webui网页

成功的话是这个页面

3,用电脑ssh连接算力云端口

4,进入微调页面

浏览器打开:http://localhost:6006/

5,数据处理与传输.

将你要微调的提示词文件放入/root/LLaMA-Factory/data/目录下。

打开/root/LLaMA-Factory/data/dataset_info.json然后内部加上你的数据的josn格式

"law_sft_dataset": { "file_name": "law_sft_dataset_output.json" }, #等于是你要注册才能在网页上找到

6,调整参数开始训练.

注意点:

7,训练过程:

8,训练结果

9,微调与原模型合并

最终就得到了进行特殊提示词微调后的模型了。

http://www.lryc.cn/news/594873.html

相关文章:

  • 【深度学习新浪潮】如何系统性地学习扩散模型?
  • 分布式定时任务系列13:死循环是任务触发的银弹?
  • uniapp 输入时动态修改值(如含单位)光标被强制移至末尾
  • docker 软件bug 误导他人 笔记
  • 装饰器模式分析
  • java解析nc气象数据
  • numpy库的基础知识
  • 用Dify构建气象智能体:从0到1搭建AI工作流实战指南
  • React-useEffect的闭包陷阱(stale closure)
  • react 录音功能
  • 《Linux 环境下 Nginx 多站点综合实践:域名解析、访问控制与 HTTPS 加密部署》​
  • 大模型——Prompt 优化还是模型微调
  • Ubuntu 22.04 安装 Docker (安装包形式)
  • WPF 项目设置应用程序图标和设置程序集图标
  • 移星科技 modbus-tcp 转 modbus-Rtu模块
  • (数据结构)线性表(中):SLIst单链表
  • tcpdump 命令解析(随手记)
  • IOPaint+CPolar:零公网IP也能搭建专属AI图像编辑平台
  • 高级技术【Java】【反射】【注解】【动态代理】
  • 复习博客:JVM
  • 【Project】ELK 7.17.16 日志分析系统部署
  • 阿里云平台使用的ack创建的pod与服务器中的MongoDB不在同一网段如何解决
  • 【图像处理基石】什么是相机的内外参数?
  • 单表查询-分页提前获取数据
  • 自动化与安全 - 将 Terraform 集成到 CI/CD
  • 安装pytorch(cpu版)
  • 电科金仓2025发布会,国产数据库的AI融合进化与智领未来
  • 【Lucene】SimScorer
  • 【Spring AI】Advisors API—顾问(即拦截器)
  • 轨迹优化 | 基于边界中间值问题(BIVP)的路径平滑求解器(附C++/Python仿真)