当前位置: 首页 > news >正文

【Tauri】(5):本地运行candle和 qwen 大模型,并测试速度

1,本地运行candle

关于candle项目
https://github.com/huggingface/candle

Hugging Face 使用rust开发的高性能推理框架。
语法简单, 风格与 PyTorch 相似。
CPU 和 Cuda Backend:m1、f16、bf16。
支持 Serverless(CPU)、小型和快速部署
支持 WASM,可在浏览器中运行模型。

2,使用CPUP 运行qwen2-1.5大模型

cargo run --example qwen -- --model-id Qwen/Qwen1.5-0.5B-Chat --prompt 北京景点推荐

因为网络原因,需要修改地址:

把 https://huggingface.co 修改成 https://hf-mirror.com/

    pub fn from_cache(cache: Cache) -> Self {let token = cache.token();let progress = true;Self {endpoint: "https://huggingface.co".to_string(),url_template: "{endpoint}/{repo_id}/resolve/{revision}/{filename}".to_string(),cache,token,progress,}}

~/cargo/registry/src/rsproxy.cn-0dccff568467c15b/hf-hub-0.3.2/src/api/sync.rs
在这里插入图片描述

否则会报错,访问不到:

     Running `target/debug/examples/qwen --model-id Qwen/Qwen1.5-0.5B-Chat --prompt '北京景点推荐'`
avx: true, neon: false, simd128: false, f16c: true
temp: 0.00 repeat-penalty: 1.10 repeat-last-n: 64
Error: request error: https://huggingface.co/Qwen/Qwen1.5-0.5B-Chat/resolve/main/tokenizer.json: Connection Failed: Connect error: Network is unreachable (os error 101)Caused by:0: https://huggingface.co/Qwen/Qwen1.5-0.5B-Chat/resolve/main/tokenizer.json: Connection Failed: Connect error: Network is unreachable (os error 101)1: Network is unreachable (os error 101)

3,总结下

使用 candle还是非常方便的,使用另外一种方案运行大模型。
使用 cpu 速度就慢多了,开启量化的版本也慢:
在这里插入图片描述

http://www.lryc.cn/news/317613.html

相关文章:

  • 基于udp协议的cs网络通信代码(echo版+命令行输入版+执行指令版),netstat指令
  • centos7网络命令:ping、dig、nsloopup、tcpdump
  • Excel判断CD两列在EF两列的列表中是否存在
  • 基于斑翠鸟优化算法(Pied Kingfisher Optimizer ,PKO)的无人机三维路径规划(MATLAB)
  • 同程旅行前端面试汇总
  • 小美的平衡矩阵_dp思路
  • json展示curl 请求接口返回结果
  • 2024 年排名前 5 名的 Mac 数据恢复软件分享
  • 请描述一下Spring MVC的工作流程。在Spring MVC中,DispatcherServlet的作用是什么?
  • 2023年终总结——跌跌撞撞不断修正
  • OPPO后端二面,凉了!
  • Unity3d版白银城地图
  • 【PCL】(二十八)点云超体素分割
  • Socket通信Demo(Unity客户端和C#)
  • Lucene 自定义词库
  • 【LeetCode热题100】73. 矩阵置零(矩阵)
  • 使用Barrier共享鼠标键盘,通过macos控制ubuntu系统
  • c++:类和对象中:拷贝构造和赋值运算符重载详解
  • Day33:安全开发-JavaEE应用SQL预编译Filter过滤器Listener监听器访问控制
  • Log4j如何支持多线程环境?你如何优化Log4j的性能?
  • golang sync.Pool 指针数据覆盖问题
  • VUE+内置iframe传值失效问题解决
  • Day31:安全开发-JS应用WebPack打包器第三方库JQuery安装使用安全检测
  • Go Zero微服务个人探究之路(十六)回顾api服务和rpc服务的本质
  • 基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的夜间车辆检测系统(深度学习代码+UI界面+训练数据集)
  • Spring体系架构
  • 【PLC】现场总线和工业以太网汇总
  • 【吊打面试官系列】Java虚拟机JVM篇 - 关于JVM分析
  • Mysql锁与MVCC
  • rancher是什么