当前位置: 首页 > news >正文

书生·浦语大模型实战营第二期作业五

1、开发机创建conda环境:

2、安装第三方库:

3、新建pipeline_transformer.py文件,并运行:

4、运行结果:

5、执行模型:

6、与大模型进行对话:

7、默认占有的显存:

8、--cache-max-entry-count参数设置为0.5后占用的显存:

9、--cache-max-entry-count参数设置为0.01后占用的显存:

10、使用W4A16量化:

11、将kvcache降低为0.01,显存变为:

12、启动api服务:

13、网页客户端连接api服务器:

14、python代码集成大模型:

【拓展部分】

1、安装llava依赖库:

2、速度测试transformer:

速度测试lmdeploy:

http://www.lryc.cn/news/373630.html

相关文章:

  • 树莓派4B_OpenCv学习笔记9:图片的腐蚀与膨胀
  • Perplexity AI — 探索网络,发掘知识,沟通思想
  • RPC知识
  • 【爬虫】requests 结合 BeautifulSoup抓取网页数据
  • 安全测试框架 二
  • 安徽京准-NTP网络授时服务器助力助力甘南州公共资源交易
  • 大数据—什么是大数据?
  • 德克萨斯大学奥斯汀分校自然语言处理硕士课程汉化版(第十一周) - 自然语言处理扩展研究
  • 支持向量机(SVM)中核函数的本质意义
  • SpringBoot使用jasypt实现数据库信息的脱敏,以此来保护数据库的用户名username和密码password(容易上手,详细)
  • Python日志配置策略
  • 想学编程,什么语言最好上手?
  • binlog和redolog有什么区别
  • Linux笔记--ubuntu文件目录+命令行介绍
  • 71、最长上升子序列II
  • 解决必剪电脑版导出视频缺斤少两的办法
  • 新人学习笔记之(常量)
  • Lua解释器裁剪
  • web前端设计nav:深入探索导航栏设计的艺术与技术
  • 分析解读NCCL_SHM_Disable与NCCL_P2P_Disable
  • 使用 Python 进行测试(6)Fake it...
  • Flink Watermark详解
  • LeetCode538.把二叉搜索树转换为累加树
  • 关于编程思想
  • 521. 最长特殊序列 Ⅰ(Rust单百解法-脑筋急转弯)
  • 【YashanDB知识库】PHP使用OCI接口使用数据库绑定参数功能异常
  • 深入分析 Android BroadcastReceiver (三)
  • 在java中使用Reactor 项目中的一个类Mono,用于表示异步单值操作
  • LabVIEW故障预测
  • 掌握JavaScript中的`async`和`await`:循环中的使用指南