当前位置: 首页 > news >正文

如何利用开源工具搭建AI大模型底座

开源社区是技术发展的一个重要部分,对于AI大模型来说,也是如此。

我们在这篇文章中来尝试通过开源工具来构建AI大模型的底座,涉及到的技术包括:

  • Langchain
  • OpenAI
  • Flowise
  • LocalAI
  • Llama

使用Langchain构建第一个对话应用

如果你使用过ChatGPT,你应该知道它是一个基于大语言模型的应用程序,可以与人类进行多轮对话。

为了让大语言模型能够与人类友好的多轮对话,我们需要引入两个额外组件:

  1. ConversationBufferMemory,它帮助LLM记录我们的对话过程。
  2. ConversationChain,它帮我们管理整个绘画过程,通过调用BufferMemory中的对话信息,它可以让无状态的LLM了解我们的对话上下文。

我们可以使用下面的代码来通过Langchain实现一个简易版的ChatGPT:

from langchain.llms import OpenAI
from langchain.chains import ConversationChain
from langchain.memory import ConversationBufferMemoryimport os
os.environ["OPENAI_API_KEY"] = '...'llm = OpenAI(temperature=0)
mem = ConversationBufferMemory()# Here it is by default set to "AI"
conversation = ConversationChain(llm=llm, verbose=True, memory=mem)conversation.predict(input="Hi there!")

通过Flowise零代码搭建LLM应用平台

Flowise官网:https://flowiseai.com/

Flowise is a low-code/no-code drag & drop tool with the aim to make it easy for people to visualize and build LLM apps.

我们可以在Windows/Mac/Linux中安装Flowise,以Linux为例,安装Flowise步骤如下:

  1. 安装NodeJS
  2. 安装Docker和Docker compose
  3. 运行下面的脚本安装和启动Flowise
    npm install -g flowise
    npx flowise start

我们可以通过http://{server}:3000 来访问Flowise,截图如下:
在这里插入图片描述

通过Flowise Portal,我们可以创建新的Chatflow,在打开的flow页面,我们可以通过拖拽的方式,来构建flow:
在这里插入图片描述
例如,我们上面提到的通过Langchain来构建简易ChatGPT应用,创建出来的flow如下截图:

在这里插入图片描述

我们可以通过页面右上角的对话按钮,对我们的flow进行测试:
在这里插入图片描述

在LLM应用中引入领域知识库

在实际应用中,我们可以为模型增加外部记忆,在提示词中引入一些领域知识,来帮助模型提升回答质量。

这种方式的具体步骤如下:

  1. 对输入文档进行切片,生成语义向量(Embedding),存入向量数据库作为外部记忆。
  2. 根据所提的问题,检索向量数据库,获取文档中的内容片段。
  3. 把文档片段和所提的问题一并组织成提示词,提交给大语言模型,让其理解文档内容,针对问题生成恰当的答案。

为了实现这个应用,我们需要引入以下组件:

  1. Docx File Loader,负责加载外部输入的文档。
  2. Recursive Character Text Splitter,用来对文档内容进行断句切片。
  3. OpenAI Embeddings,负责将断句后的内容切片映射成高维Embedding。
  4. In-Memory Vector Store,负责将Embedding存入数据库中,供LLM作为外部记忆。
  5. Conversational Retrieval QA Chain,负责根据问题,获得外部知识,在LLM思考生成答案后返回给用户。

使用Flowise构建上述的应用,截图如下:

在这里插入图片描述

使用LocalAI做可用LLM应用

我们前面做的LLM应用都依赖于OpenAI API,会有一些风险,我们可以考虑构建本地大模型。

我们可以基于LocalAI开源应用来实现这一点。

下面是搭建过程:

$ git clone https://github.com/go-skynet/LocalAI
$ cd LocalAI

我们使用一个小模型进行部署。

$ wget https://gpt4all.io/models/ggml-gpt4all-j.bin -O models/ggml-gpt4all-j
$ cp -rf prompt-templates/ggml-gpt4all-j.tmpl models/

然后我们可以加载models并将其封装为API服务。

$ docker-compose pull
$ docker-compose up -d

接下来是获取model列表进行验证。

$ curl http://localhost:8080/v1/models
{"object":"list","data":[{"id":"ggml-gpt4all-j","object":"model"}]}

这样我们可以修改Flowise,使用本地模型代替OpenAI。
在这里插入图片描述

使用Llama2构建LLM应用

我们还可以使用Llama2来构建LLM应用,这在应用许可上更加友好。

我们可以下载Llama2模型文件。

$ wget -c "https://huggingface.co/TheBloke/Llama-2-7B-chat-GGML/resolve/main/llama-2-7b-chat.ggmlv3.q4_0.bin" ./models

然后重启LocalAI,查看Llama2是否被正常部署。

$ curl -v  http://localhost:8080/v1/models
{"object":"list","data":[{"id":"llama-2-7b-chat.ggmlv3.q4_0.bin","object":"model"}]}

我们可以返回Flowise flow,将模型名字修改为llama-2-7b-chat.ggmlv3.q4_0.bin,这样我们就可以使用Llama2来回答我们的问题。

再进一步,我们还可以尝试使用AutoGPT或者AgentGPT来构建更加负责的LLM应用,帮助我们完成更有挑战性的事情。

http://www.lryc.cn/news/153921.html

相关文章:

  • 算法笔记:二叉树
  • 1. 安装Zookeeper
  • warning: ignoring unsupported character ‘问题修复
  • 【Ant Design】Form.Item创建自定义表单
  • Vision Transformer(VIT 网络架构)
  • 数学建模--蒙特卡洛模型的Python实现
  • MySQL访问和配置
  • note_前端框架Vue的安装和简单入门(Windows 11)
  • SILERGY(矽力杰)功率电子开关 SY6280AAC
  • mysql char 和varchar的区别?
  • HttpClient默认重试机制
  • 论文于祥读及复现——《Multi-level Map Construction for Dynamic Scenes》
  • IDEA 报 Cannot resolve symbol ‘HttpServletResponse‘ 解决
  • linux-samba-window登不上
  • Java Web3J :使用web3j监听、查询、订阅智能合约的事件
  • C语言入门 Day_13 二维数组
  • 通过HFS低成本搭建NAS,并内网穿透实现公网访问
  • 【SpringMVC】工作流程及入门案例
  • 【JVM】垃圾收集算法
  • K8s的Pod出现Init:ImagePullBackOff问题的解决(以calico为例)
  • 数据结构 -作用及基本概念
  • 数学建模--时间序列预测模型的七种经典算法的Python实现
  • nginx-反向代理缓存
  • 大模型重塑区域人才培养,飞桨(重庆)人工智能教育创新中心正式启动
  • PAT 1164 Good in C 测试点3,4
  • LabVIEW对EAST长脉冲等离子体运行的陀螺稳态运行控制
  • Fragment
  • 哈希表-救赎金
  • vue3+vite+ts项目适配各种分辨率解决方案
  • Python Opencv实践 - 矩形轮廓绘制(直边矩形,最小外接矩形)