当前位置：首页 > news >正文

基于deepseek的LORA微调

news 2025/7/22 7:29:53

LORA微调：

核心是：低秩转换，减少参数。冻结大部分，调节部分模块(注意力模块的Wq，Wk，Wv)。

调整过后得到一个lora.safetensors, 内部记录了(detail W: 即部分修改的W)。推理使用原权重和lora权重。

具体操作：

1,先进行工具，与库的下载

source /etc/network_turbo #先设置镜像 git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git # 下载工具库代码 cd LLaMA-Factory # 进入文件夹 pip install -e ".[torch,metrics]" # 下载环境 llamafactory-cli version #查看版本安装成功会有对应的版本

2,LLaMA-Factory运行网页管理页面

export GRADIO_SERVER_PORT=6006 # 设置临时端口 echo $GRADIO_SERVER_PORT # 查看是否设置成功 llamafactory-cli webui # 设置成功可以开启webui网页

成功的话是这个页面

3,用电脑ssh连接算力云端口

4,进入微调页面

浏览器打开:http://localhost:6006/

5，数据处理与传输.

将你要微调的提示词文件放入/root/LLaMA-Factory/data/目录下。

打开/root/LLaMA-Factory/data/dataset_info.json然后内部加上你的数据的josn格式

"law_sft_dataset": { "file_name": "law_sft_dataset_output.json" }, #等于是你要注册才能在网页上找到

6，调整参数开始训练.

注意点：

7,训练过程:

8,训练结果

9,微调与原模型合并

最终就得到了进行特殊提示词微调后的模型了。

http://www.lryc.cn/news/594873.html

相关文章：

【深度学习新浪潮】如何系统性地学习扩散模型？

分布式定时任务系列13：死循环是任务触发的银弹？

uniapp 输入时动态修改值（如含单位）光标被强制移至末尾

docker 软件bug 误导他人笔记

装饰器模式分析

java解析nc气象数据

numpy库的基础知识

用Dify构建气象智能体：从0到1搭建AI工作流实战指南

React-useEffect的闭包陷阱(stale closure)

react 录音功能

《Linux 环境下 Nginx 多站点综合实践：域名解析、访问控制与 HTTPS 加密部署》

大模型——Prompt 优化还是模型微调

Ubuntu 22.04 安装 Docker （安装包形式）

WPF 项目设置应用程序图标和设置程序集图标

移星科技 modbus-tcp 转 modbus-Rtu模块

（数据结构）线性表（中）：SLIst单链表

tcpdump 命令解析（随手记）

IOPaint+CPolar：零公网IP也能搭建专属AI图像编辑平台

高级技术【Java】【反射】【注解】【动态代理】

复习博客：JVM

【Project】ELK 7.17.16 日志分析系统部署

阿里云平台使用的ack创建的pod与服务器中的MongoDB不在同一网段如何解决

【图像处理基石】什么是相机的内外参数？

单表查询-分页提前获取数据

自动化与安全 - 将 Terraform 集成到 CI/CD

安装pytorch（cpu版）

电科金仓2025发布会，国产数据库的AI融合进化与智领未来

【Lucene】SimScorer

【Spring AI】Advisors API—顾问（即拦截器）

轨迹优化 | 基于边界中间值问题(BIVP)的路径平滑求解器(附C++/Python仿真)