当前位置: 首页 > news >正文

【Tauri】(2):使用Tauri应用开发,使用开源的Chatgpt-web应用做前端,使用rust 的candle做后端,本地运行小模型桌面应用

视频演示地址

https://www.bilibili.com/video/BV17j421X7Zc/

【Tauri】(2):使用Tauri应用开发,使用开源的Chatgpt-web应用做前端,使用rust 的candle做后端,本地运行小模型桌面应用

1,做一个免费的桌面端的gpt软件方案

使用CPU 运行小模型运行 qwen 1.8B

https://www.modelscope.cn/models/qwen/Qwen-1_8B-Chat-Int4/summary

介绍(Introduction)
通义千问-1.8B(Qwen-1.8B) 是阿里云研发的通义千问大模型系列的18亿参数规模的模型。Qwen-1.8B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。同时,在Qwen-1.8B的基础上,我们使用对齐机制打造了基于大语言模型的AI助手Qwen-1.8B-Chat。本仓库为Qwen-1.8B-Chat的Int4量化模型的仓库。

通义千问-1.8B(Qwen-1.8B)主要有以下特点:

低成本部署:提供int8和int4量化版本,推理最低仅需不到2GB显存,生成2048 tokens仅需3GB显存占用。微调最低仅需6GB。
大规模高质量训练语料:使用超过2.2万亿tokens的数据进行预训练,包含高质量中、英、多语言、代码、数学等数据,涵盖通用及专业领域的训练语料。通过大量对比实验对预训练语料分布进行了优化。
优秀的性能:Qwen-1.8B支持8192上下文长度,在多个中英文下游评测任务上(涵盖常识推理、代码、数学、翻译等),效果显著超越现有的相近规模开源模型,具体评测结果请详见下文。
覆盖更全面的词表:相比目前以中英词表为主的开源模型,Qwen-1.8B使用了约15万大小的词表。该词表对多语言更加友好,方便用户在不扩展词表的情况下对部分语种进行能力增强和扩展。
系统指令跟随:Qwen-1.8B-Chat可以通过调整系统指令,实现角色扮演,语言风格迁移,任务设定,和行为设定等能力。

2,前端界面界面参考使用

开源的Chatgpt-web应用
https://blog.csdn.net/freewebsys/article/details/129679034

在这里插入图片描述

3,后端使用rust 的candle 项目

本地启动小模型的chatgpt服务

https://github.com/huggingface/candle

已经可以支持 chatglm 和 qwen 大模型了

https://github.com/huggingface/candle/blob/main/candle-examples/examples/chatglm/main.rs

在这里插入图片描述

然后就可以进行前后的连调了。

4,整个设计方案,和用到的技术

在这里插入图片描述

http://www.lryc.cn/news/298550.html

相关文章:

  • C#where T :通用的泛型约束(generic constraint)语法
  • vue使用Mars3d弹框嵌套video视频/实时视频(m3u8)使用hls.js
  • Python爬虫之Ajax数据爬取基本原理
  • osg操控器和键盘切换操控器学习
  • LeetCode1143. Longest Common Subsequence——动态规划
  • 利用Windows10漏洞破解密码(保姆级教学)
  • apk反编译修改教程系列---简单修改apk默认横竖屏显示 手机端与电脑端同步演示【十一】
  • 2301: 不定方程解的个数
  • vue3学习——封装菜单栏
  • 深度学习的进展及其在各领域的应用
  • blender怎么保存窗口布局,怎么设置默认输出文件夹
  • 【开源】基于JAVA+Vue+SpringBoot的实验室耗材管理系统
  • 【ES】--Elasticsearch的分词器详解
  • 【算法】{画决策树 + dfs + 递归 + 回溯 + 剪枝} 解决排列、子集问题(C++)
  • sqlserver 存储过程
  • C语言什么是悬空指针?
  • AES加密后的密码可以破解吗
  • vue3学习——路由进度条
  • VMware虚拟机安装Windows系统教程
  • vue3学习——router-view 过渡动画
  • 从HSE攻击事件漫谈针对勒索攻击防御的两大误区
  • 设计模式(结构型模式)外观模式
  • C语言函数的栈帧与销毁(面试亮点)
  • 使用 GreenSock(GSAP)实现 字符串动画
  • linux系统zabbix监控服务端部署
  • 算法----回溯(附录---剪枝)
  • 从Unity到Three.js(模型文件加载)
  • Webshell一句话木马
  • 【Web】Spring rce CVE-2022-22965漏洞复现学习笔记
  • springboot/ssm大学生选修选课系统高校选课排课成绩管理系统Java系统