当前位置: 首页 > news >正文

如何在算家云搭建text-generation-webui(文本生成)

一、text-generation-webui 简介

text-generation-webui 是一个流行的用于文本生成的 Gradio Web UI。支持 transformers、GPTQ、AWQ、EXL2、llama.cpp (GGUF)、Llama 模型。

它的特点如下,

  • 3 种界面模式:default (two columns), notebook, chat
  • 支持多个模型后端:Transformers、llama.cpp(通过 llama-cpp-python)、ExLlama、ExLlamaV2、AutoGPTQ、AutoAWQ、GPTQ-for-LLaMa、CTransformers、QuIP#。
  • 下拉菜单可在不同模型之间快速切换。
  • 大量扩展(内置和用户贡献),包括用于真实语音输出的 Coqui TTS、用于语音输入的 Whisper STT、翻译、多模式管道、向量数据库、Stable Diffusion 集成等等。
  • 与自定义角色聊天。
  • 适用于指令跟踪模型的精确聊天模板,包括 Llama-2-chat、Alpaca、Vicuna、Mistral。
  • LoRA:使用您自己的数据训练新的 LoRA,动态加载/卸载 LoRA 以进行生成。
  • Transformers 库集成:通过 bitsandbytes 以 4 位或 8 位精度加载模型,将 llama.cpp 与 Transformers 采样器( llamacpp_HF 加载器)结合使用,使用 PyTorch 以 32 位精度进行 CPU 推理。
  • 具有 OpenAI 兼容的 Chat 和 Completions API 服务器 。

二、模型搭建流程

1. 容器镜像一键使用

镜像环境: RXT3090 nvidia/cuda/12.4.1-cudnn-runtime-ubuntu20.04

(1)进入算家云“租用实例”页面,点击“应用社区”,选择text-generation-webui

image.png

image.png

(2)选择 3090 卡或 其他性能优于 3090 的显卡,点击“立即创建”即可创建实例

image.png

2.进入创建的实例

在“项目实例”页面点击对应实例的“Web SSH”进入终端操作

b5ad37cf876cdd60c5925a98f471107.jpg

image.png

以下命令均在该页面进行:

conda activate textcd /text-generation-webui/modelsgit lfs installgit clone https://www.modelscope.cn/Xorbits/vicuna-7b-v1.3.git

启动运行模型

cd /
cd text-generation-webui python server.py --model vicuna-7b-v1.3 --listen --listen-port 8080

3.开启外部访问获取访问链接

返回“项目实例”列表,选择并点击对应实例的“开放端口”操作。

image.png

有两种访问方式可以选择:本地私密访问和对外开放端口

(1)本地私密访问:选择 ssh 工具访问,登录之后填写各选项,点击“开启代理”

image.png

(2)对外开放端口:请按照下图操作

image.png

三、网页演示

运行成功后获取访问链接,即可进入 webUI 界面使用

image.png

以上就是在算家云搭建text-generation-webui的流程,具体使用方式可进入算家云应用社区查看该模型的使用说明。

点击应用社区,进入算家云,选择模型,一键开启 AI 之旅!

首页.png

http://www.lryc.cn/news/448882.html

相关文章:

  • 【Java SE】初遇Java,数据类型,运算符
  • XSS(内含DVWA)
  • 【SpringCloud】环境和工程搭建
  • 基于Java开发的(控制台)模拟的多用户多级目录的文件系统
  • tailwindcss group-hover 不生效
  • python环境配置问题(个人经验)
  • BERT训练之数据集处理(代码实现)
  • 一款辅助渗透测试过程,让渗透测试报告一键生成
  • 力扣最热一百题——颜色分类
  • 2024年工业制造企业CRM研究报告:需求清单、市场格局、案例分析
  • Spring MVC参数接收 总结
  • Docekrfile和docker compose编写指南及注意事项
  • VITS源码解读6-训练推理
  • 力扣 简单 104.二叉树的最大深度
  • 单片机长短按简单实现
  • 如何用好通义灵码企业知识库问答能力?
  • C语言自定义类型:联合体
  • 【JavaEE】——线程池大总结
  • 编程中为什么使用0和1表示状态
  • C++入门基础知识90(实例)——实例15【求两数的最大公约数】
  • 自动化办公-Python-os模块的使用
  • 无人机之数据处理技术篇
  • 828华为云征文|部署多功能集成的协作知识库 AFFiNE
  • c++(AVL树及其实现)
  • Cesium GIS项目关于湖泊识别与提取的实现
  • 两个圆形 一个z里面一个z外面,z里面的大,颜色不同 html
  • 【Power Query】M函数-table
  • uni-app 封装websocket 心跳检测,开箱即用
  • ASP.NET Core8.0学习笔记(十九)——EF Core DbSet
  • Android Camera 预览角度和拍照保存图片角度相关