当前位置: 首页 > news >正文

Baichuan2百川模型部署的bug汇总

1.4bit的量化版本最好不要在Windows系统中运行,大概原因报错原因是bitsandbytes不支持window,bitsandbytes-windows目前仅支持8bit量化。

2.在这里插入图片描述

报错原因是机器没有足够的内存和显存,offload_folder设置一个文件夹来保存那些离线加载到硬盘的权重。
ag:需要再cli_demo.py的文件中增加
在这里插入图片描述

offload_folder="offload" model.float()

3.安装对应的cuda版本 Python版本 pytorch版本
读者有bug可以在评论区留言,我会尽可能回复解答

http://www.lryc.cn/news/284898.html

相关文章:

  • ChatGPT 如何解决 “Something went wrong. lf this issue persists ….” 错误
  • 怎么移除WordPress后台工具栏的查看站点子菜单?如何改为一级菜单?
  • WEB-前端 表格标签-合并单元格
  • [计算机网络]基本概念
  • Flutter 综述
  • Pixels:重新定义游戏体验的区块链农场游戏
  • 【JavaEE】文件操作 —— IO
  • 推荐新版AI智能聊天系统网站源码ChatGPT NineAi
  • 学生公寓智能控电系统的重要性
  • 使用Scrapy 爬取“http://tuijian.hao123.com/”网页中左上角“娱乐”、“体育”、“财经”、“科技”、历史等名称和URL
  • 2018年认证杯SPSSPRO杯数学建模D题(第二阶段)投篮的最佳出手点全过程文档及程序
  • 软件资源管理下载系统全新带勋章功能 + Uniapp前端
  • 高性能前端UI库 SolidJS | 超棒 NPM 库
  • 聊聊PowerJob的AliOssService
  • 【VRTK】【Unity】【PICO】PICO项目打包后闪退的根本原因
  • 《PCI Express体系结构导读》随记 —— 第I篇 第2章 PCI总线的桥与配置(21)
  • 大数据前馈神经网络解密:深入理解人工智能的基石
  • 【新书推荐】Web3.0应用开发实战(从Web 2.0到Web 3.0)
  • vue3中状态管理库pinia的安装和使用方法介绍及和vuex的区别
  • 领略指针之妙
  • 迭代器模式介绍
  • 算法每日一题: 最大字符串匹配数目 | 哈希 | 哈希表 | 题意分析
  • 自然语言处理(Natural Language Processing,NLP)解密
  • 【DevOps-08-5】目标服务器准备脚本,并基于Harbor的最终部署
  • 用Java实现01背包问题 用贪心算法
  • JUC并发编程-8锁现象
  • 集美大学“第15届蓝桥杯大赛(软件类)“校内选拔赛 D矩阵选数
  • Android System Service系统服务--1
  • 【RT-DETR有效改进】华为 | Ghostnetv1一种专为移动端设计的特征提取网络
  • 45个经典Linux面试题!赶紧收藏!