当前位置: 首页 > news >正文

【ms-swift 大模型微调实战】

安装环境

  • pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
  • pip install modelscope vllm ‘ms-swift[llm]’ -U

下载模型

  • modelscope download --model Qwen/Qwen2.5-7B-Instruct --local_dir ./Qwen2.5-7B-Instruct

微调

  • 实验环境:4 * A100# 显存占用:4 * 70GB
    NPROC_PER_NODE=4 CUDA_VISIBLE_DEVICES=0,1,2,3 swift sft \--model_type qwen2_5-72b-instruct \--model_id_or_path Qwen2.5-72B-Instruct \--dataset qwen2-pro-en#500 qwen2-pro-zh#500 self-cognition#500 \--logging_steps 5 \--learning_rate 1e-4 \--output_dir output \ --lora_target_modules ALL \--model_name 小黄 'Xiao Huang' \--model_author 魔搭 ModelScope \--deepspeed default-zero3
  • 单卡A10/3090可运行的例子 (Qwen2.5-7B-Instruct)# 显存占用:24GB
  	CUDA_VISIBLE_DEVICES=0 swift sft \--model_type qwen2_5-7b-instruct \--model_id_or_path Qwen2.5-7B-Instruct \--dataset qwen2-pro-en#500 qwen2-pro-zh#500 self-cognition#500 \--logging_steps 5 \--max_length 2048 \--learning_rate 1e-4 \--output_dir output \--lora_target_modules ALL \--model_name 小黄 'Xiao Huang' \--model_author 魔搭 ModelScope

融合lora

CUDA_VISIBLE_DEVICES=0,1 swift export \    --ckpt_dir output/qwen2_5-72b-instruct/vx-xxx/checkpoint-xxx \    --merge_lora true

vLLM部署

vllm serve xxxxx-checkpoint-merged [opentional args]

参考

  • Qwen2.5 全链路模型体验、下载、推理、微调、部署实战!
  • https://github.com/modelscope/ms-swift
  • 自定义数据集
  • 微调文档
  • 推理文档
http://www.lryc.cn/news/473736.html

相关文章:

  • Linux:网络基础
  • mysql 的内连接、左连接、右连接有什么区别?
  • update-alternatives(选择工具)
  • php解密,sg11解密-sg15解密 如何由sourceGuardian11-sourceGuardian15加密(sg11加密~sg15加密)的源码
  • b站小土堆PyTorch视频学习笔记(二)
  • Linux的压缩及其解压命令
  • GXYCTF2019:gakki
  • 顺序表(C 语言)
  • 一:时序数据库-Influx应用
  • Word文档丢失抢救方法:15 个 Word 文档恢复工具
  • 关于自动驾驶等级相关知识
  • Java中跳转结构
  • CNN-Attention分类预测 | Matlab实现多特征分类预测
  • [java][基础]JSP
  • 《测绘学报》
  • 代码随想录之链表刷题总结
  • Python爬虫的“京东大冒险”:揭秘商品类目信息
  • 双目视觉标定——1原理与实践
  • 【设计模式系列】代理模式(八)
  • 微服务架构设计的初次尝试——基于以太坊智能合约 + NestJS 微服务的游戏社区与任务市场系统:架构设计
  • “北斗+实景三维”,助力全域社会治理
  • #渗透测试#SRC漏洞挖掘# 信息收集-常见端口及谷歌语法
  • 如何使用java雪花算法在分布式环境中生成唯一ID?
  • 【php常用公共函数】php获取指定时间段相差几小时,几分钟,几秒
  • 图文深入介绍Oracle DB link(一)
  • Uniswap/v2-core使用及其交易流程
  • clickhouse运维篇(二):多机器手动部署ck集群
  • OpenCV视觉分析之目标跟踪(7)目标跟踪器类TrackerVit的使用
  • Java 实现 RESTful 风格的 Web 服务详解
  • 18.网工入门篇--------今天介绍下广域网技术