当前位置: 首页 > news >正文

构建中国人自己的私人GPT—支持中文

上一篇已经讲解了如何构建自己的私人GPT,这一篇主要讲如何让GPT支持中文。

a7dcd7b0e52c4efda096c09d6f70f222.jpeg


privateGPT 本地部署目前只支持基于llama.cpp 的 gguf格式模型,GGUF 是 llama.cpp 团队于 2023 年 8 月 21 日推出的一种新格式。它是 GGML 的替代品,llama.cpp 不再支持 GGML。

本文主要采用国产YI-34B-CHAT模型。
1.模型下载
yi模型下载:TheBloke/Yi-34B-Chat-GGUF · Hugging Face

下载后放置在 models 文件夹下
embedding模型下载:BAAI/bge-small-en-v1.5 · Hugging Face

下载后放置在models/cache文件夹下,bge is short for BAAI general embedding,FlagEmbedding 可以将任何文本映射到低维密集向量,该向量可用于检索、分类、聚类或语义搜索等任务。它还可以用于法学硕士的矢量数据库

2.settings.yaml 文件修改:
主要修改local部分,使用YI模型使用prompt_style: "tag"类型的提示词模板

llm_hf_model_file: yi-34b-chat.Q4_K_M.gguf
prompt_style: "tag"

3.代码修改
使用YI-34B-CHAT模型,源码要简单修改下,修改如下

文件路径 privateGPT/private_gpt/components/llm/llm_component.py

第44行,添加如下内容:

generate_kwargs={'stop':['<|im_end|>']},

如图:

87a7f5bd9b0a70cee1b39687f070c8ed.png

导航到 UI:在浏览器中打开 http://localhost:8001/。
 

e2e8717aa27ecb638b17e7692e1585e7.png





创作不易,多多支持!

 

 

http://www.lryc.cn/news/295127.html

相关文章:

  • elementui 回到顶部报错
  • go-carbon v2.3.8 发布,轻量级、语义化、对开发者友好的 golang 时间处理库
  • 【详解】斗地主随机发牌项目
  • 多账号运营为什么要使用动态住宅代理IP?
  • [C++] 如何使用Visual Studio 2022 + QT6创建桌面应用
  • Arduino 推出基于乐鑫 ESP32-S3 的 STEM 教育机器人
  • Blender使用Rigify和Game Rig Tool基础
  • 【Unity优化(一)】音频优化
  • 算法.1-三大排序算法-对数器-二分
  • Midjourney新功能介绍:风格参考(Style References)详解
  • C++ 11/14/17 智能指针
  • C++入门【37-C++ 拷贝构造函数】
  • [UI5 常用控件] 06.Splitter,ResponsiveSplitter
  • C遗漏知识(个人向)
  • ERR_SSL_VERSION_OR_CIPHER_MISMATCH
  • 2.5作业
  • linux系统lvs命令的使用
  • PoEAA笔记-7.分布策略
  • Spring Boot 整合 Redis 使用教程
  • 用友U8 Cloud ReportDetailDataQuery SQL注入漏洞复现(QVD-2023-47860)
  • docker镜像命令
  • 通义千问上线春节新应用,AI帮你免费拍全家福
  • RabbitMQ 安装
  • 如何让MySQL从部署到稳定运行?
  • go 内存二进制数据操作
  • Antd+React+react-resizable实现表格拖拽功能
  • StringBuilder类常用方法(Java)
  • Iceberg从入门到精通系列之二十一:Spark集成Iceberg
  • Linux的进程信号
  • svn常用命令及过滤文件 global ignore pattern