当前位置: 首页 > news >正文

[书生·浦语大模型实战营]——LMDeploy 量化部署 LLM 实践

1.基础作业

1.1配置 LMDeploy 运行环境

创建开发机

创建新的开发机,选择镜像Cuda12.2-conda;选择10% A100*1GPU;点击“立即创建”。注意请不要选择Cuda11.7-conda的镜像,新版本的lmdeploy会出现兼容性问题。其他和之前一样,不赘述。

创建conda环境

studio-conda -t lmdeploy -o pytorch-2.1.2

安装LMDeploy

#激活虚拟环境
conda activate lmdeploy
#安装0.3.0的imdeploy
pip install lmdeploy[all]==0.3.0

1.2以命令行方式与 InternLM2-Chat-1.8B 模型对话

在这里插入图片描述
在这里插入图片描述

2.进阶作业

2.1 设置KV Cache最大占用比例为0.4,开启W4A16量化,以命令行方式与模型对话。

在这里插入图片描述
在这里插入图片描述

2.2 以API Server方式启动 lmdeploy,开启 W4A16量化,调整KV Cache的占用比例为0.4,分别使用命令行客户端与Gradio网页客户端与模型对话。

命令行:
在这里插入图片描述
在这里插入图片描述
网页客户端:
在这里插入图片描述

2.3 使用W4A16量化,调整KV Cache的占用比例为0.4,使用Python代码集成的方式运行internlm2-chat-1.8b模型。

在这里插入图片描述

2.4 使用 LMDeploy 运行视觉多模态大模型 llava gradio demo。

在这里插入图片描述
在这里插入图片描述

http://www.lryc.cn/news/368603.html

相关文章:

  • TiDB-从0到1-配置篇
  • 微信小程序按钮设计与交互:打造极致用户体验
  • ES6中如何使用class和extends关键字实现继承?
  • Linux:基本指令
  • 商业C++静态代码检测工具PC-lint Plus 、 polysace和sonarqube对比
  • 邬家桥公园
  • Flutter 中的 RenderObjectToWidgetAdapter 小部件:全面指南
  • SNAT与DNAT
  • MySql八股文知识点总结,一篇文章让mysql成为面试加分项
  • Python 很好用的爬虫框架:Scrapy:
  • C/C++|关于 namespace 在C++中的代码组织
  • selenium自动化测试入门 —— 上传文件
  • C# Math.Round() 四舍六入五取偶
  • springboot手动触发参数校验,service层调用参数校验
  • 动手学深度学习4.10 实战Kaggle比赛:预测房价-笔记练习(PyTorch)
  • 1035 插入与归并(测试点6)
  • 什么情况下需要使用分布式事务,有哪些方案?
  • Java加密体系结构参考指南-Java Cryptography Architecture
  • C++中避免内存泄漏的方法
  • 5.1 实体完整性
  • (学习笔记)数据基建-数据质量
  • WINUI——Behavior(行为)小结
  • Ruoyi5.x RuoYi-Vue-Plus新建Translation翻译类
  • 类加载的奥秘
  • Spring知识点总结
  • STM32Cube系列教程11:STM32 AES加解密模块性能测试
  • Vue2基础:.sync修饰符的使用,认识,作用,本质案例演示,实现父子之间的通信。
  • 【数据结构与算法】使用单链表实现队列:原理、步骤与应用
  • DHCP服务
  • C++笔试-剑指offer