当前位置: 首页 > news >正文

【LLM】低成本部署大语言模型, 并且还能达到部署在GPU上差不多的效果

目录

前言

部署 

效果

问题1:人类为什么需要睡觉?

问题2:世界上最高的山峰是什么?


前言

点进来看本文的应该都知道模型对硬件的要求很高, 那我也不废话了, 直接安排最近发现的一个开源项目, 它可以帮助我们降低部署模型的成本, 开源仓库链接:

GitHub - Jittor/JittorLLMs: 计图大模型推理库,具有高性能、配置要求低、中文支持好、可移植等特点

  • 内存要求:至少2G,推荐32G
  • 显存:可选, 推荐16G
  • 操作系统:支持Windows,Mac,Linux全平台。
  • 磁盘空间:至少40GB空闲磁盘空间,用于下载参数和存储交换文件。
  • Python版本要求至少3.8(Linux的Python版本至少3.7)。

可以看出对配件的要求不是很高,  显卡可有可无(有的话更好),我是在笔记本电脑上部署测试的,配置的话是:i5-1135G和32G内存(无独立显卡)


部署 

部署教程在开源仓库的README中写的很详细, 请自行查看, 部署过程中遇到问题可以评论提问


效果

问题1:人类为什么需要睡觉?

GPU服务器:

本机: 

问题2:世界上最高的山峰是什么?

GPU服务器: 

 本机:

我测试的模型是ChatGLM的, 效果如图所示, 相差不大


👍点赞,你的认可是我创作的动力 !
🌟收藏,你的青睐是我努力的方向!
✏️评论,你的意见是我进步的财富!

http://www.lryc.cn/news/64416.html

相关文章:

  • Doris(25):Doris的函数—Bitmap函数
  • 简单分享微信小程序上的招聘链接怎么做
  • 【英语】大学英语CET考试,翻译部分(修饰后置,定语从句,插入语,多动句,无主句)
  • 设计模式——代理模式
  • Shiro-721---漏洞复现
  • Linux【模拟实现C语言文件流】
  • APK文件结构
  • RabbitMQ死信队列延迟交换机
  • 武忠祥老师每日一题||不定积分基础训练(六)
  • C语言结构体详解
  • 非盲去模糊简单介绍
  • C语言动态内存管理与文件操作:打造高效通讯录
  • 2001-2021年全国30省就业人数数据
  • 自然语言处理知识抽取(pkuseg、DDParser安装及使用)
  • Linux内核面试知识总结
  • 深度学习模型压缩与优化加速
  • Kali 更换源(超详细,附国内优质镜像源地址)
  • Java版工程项目管理系统平台+java版企业工程系统源码+助力工程企业实现数字化管理
  • 搜索引擎测试报告
  • 4年的测试工程师,你遇到过自身瓶颈期吗?又是怎样度过的?
  • 【Python零基础学习入门篇④】——第四节:Python的列表、元组、集合和字典
  • 3.6 cache存储器
  • Ubuntu零基础安装
  • 热门的常用 API 大全分享
  • 利用粒子群算法设计无线传感器网络中的最优安全路由模型(Matlab代码实现)
  • 2023年华东杯数学建模B 题 期货价格相关性问题-思路解析
  • SAP UI5 之Controls (控件) 笔记三
  • 哈希表题目:设计地铁系统
  • 云时通OMS:为零售品牌商打造高效的全渠道订单管理!
  • 有必要给孩子买台灯吗?分享四款高品质的护眼台灯