当前位置: 首页 > news >正文

Server-Sent Event(SSE) GPT场景实现

关于SSE的基本概念可以看一下阮一峰老师的这篇文章:Server-Sent Events教程。

现在比较常见的场景是gpt回答的时候类似下图这种打字机的情况,因为AI一般响应时间会比较长,使用这种方式能让人别等那么久,是一个相对比较良好的用户体验。

在这里插入图片描述
这里简单说一下具体这个场景下的实现思路。

客户端(前端)

SSE 使用 HTTP 协议,客户端需要向服务端发起一次请求,需要定义一个fetchEventSource方法,大概这样:

		const fetchEventSource = (url, options) => {fetch(url, options).then(resp => {if (resp.status === 200) {options.onopen && options.onopen()return resp.body}}).then(rb => {const reader = rb.getReader()const push = () => {// done 为数据是否接收完成 boolean 值// value 为接收到的数据, Uint8Array 格式return reader.read().then(({done, value}) => {if (done) {options.onclose && options.onclose()return}options.onmessage && options.onmessage(new TextDecoder().decode(value))return push()});}// 开始读取流信息return push()}).catch((e) => {options.error && options.error(e)})}

定义url和options参数,url传请求的地址,options可以定义更多内容,大概像这样调用fetchEventSource方法:

			fetchEventSource('http://localhost:8000/gpt/summary', {method: 'POST',body: JSON.stringify(data),headers: {"Content-Type": "application/json","Authorization": "此处可以带接口鉴权token"},onopen: () => {console.log('连接sse成功')},onclose: () => {console.log('sse连接关闭')},onmessage: (delta) => {let prefix = 'data: 'if (!delta.startsWith(prefix)) {return;}let delta_array = delta.split(prefix);delta_array.forEach(function(element) {element = element.replace(/\n$/, '')if (element === '[DONE]\n') {return;}if (element != '') {// 可能有多个回答let choices = JSON.parse(element).choices;let content = choices[0].delta.content;console.log(content);$('#mean').append(content);}});}})

可以看到option中比实际http请求多了几个函数:onopen onclose onmessageonopen代表和服务端建立连接成功,onclose则是关闭服务端连接的时候会被调用,onmessage则是处理接口返回的数据,一般是需要处理多份数据,这里详细讲一下onmessage的处理方式。

onmessage可以看到参数是delta,假如说GPT场景下返回了“你好,我是GPT的文字”,可能第一个delta里就返回包含”你好“,第二个delta里返回“,”,第三个delta返回“我是”等等以此类推直到数据返回完毕。数据返回的格式因业务不同也会不同,但基本要做的事情就是处理并解析里面的数据,然后把这些文字拼接到页面上做显示,实现效果。

服务端(后端)

服务端的任务通常是调用gpt的接口,然后流式读取,读到什么马上返回给前端。

这里给一个python的demo:

from sse_starlette.sse import ServerSentEvent, EventSourceResponsedef create_chat_completion(messages):# 发起请求response = openai.ChatCompletion.create(engine="gpt-35-turbo",messages=messages,stream=True, # 该参数需要设置为truemax_tokens=1000)# 循环处理stream结果for item in response:# yield ServerSentEvent(json.dumps(item, ensure_ascii=False), event='delta')result = json.dumps(item)print(result)yield ServerSentEvent(json.dumps(item))@router.post("/summary")
async def summary(contentNeedSummary: posts.ContentNeedSummary, user = Depends(get_token_header)):    messages = [{"role": "system", "content": "可以预置一些系统的设置"},{"role": "user", "content": contentNeedSummary.content}]return EventSourceResponse(create_chat_completion(messages))

可以看到上面的方法,前端调用/summary接口后,进入summary函数,做一些这个方法特有的设置之后,return了EventSourceResponse(create_chat_completion(messages))。create_chat_completion再实现通用的调用gpt的方法,每得到一个响应,马上用ServerSentEvent包裹返回给前端。

也就是说,整个过程,是前端发起SSE请求服务端,服务端(可以做一些别的处理,比如鉴权和预置系统数据)再发起SSE请求GPT接口;在返回结果的过程中,GPT接口流式输出给服务端,服务端(可以做一些别的处理,比如处理好返回结果的格式,计算token成本)马上返回给前端,比如GPT接口流式输出了“你好”,服务端马上返回了“你好”给前端显示在网页上,再返回“,我是GPT”,服务端接着返回给前端显示在网页上。

这样的处理方式可以让结果尽快显示出来,也可以借由服务端的处理,保证安全和计算成本,以及处理好数据格式。

http://www.lryc.cn/news/461083.html

相关文章:

  • 美国Honeywell霍尼韦尔气体分析侦测器传感器MIDAS-K-HCL说明书
  • L1练习-鸢尾花数据集处理(分类/聚类)
  • javaweb以html方式集成富文本编辑器TinyMce
  • 大学生福音!用GPT-4o几分钟内轻松读懂一篇论文!
  • 微信小程序昵称获取
  • SQL进阶技巧:如何找出开会时间有重叠的会议室?| 时间区间重叠问题
  • Educational Codeforces Round 170 (Rated for Div. 2) D 题解
  • NeRS: Neural Reflectance Surfaces for Sparse-view 3D Reconstruction in the Wild
  • 【Linux】su 命令的运行原理以及su切换用户默认继承环境配置
  • libtorch环境配置
  • 【C语言】define宏定义与const修饰限定
  • 基于深度学习的基于视觉的机器人导航
  • 苍穹外卖学习笔记(二十三)
  • vLLM 推理引擎性能分析基准测试
  • 图像增强论文精读笔记-Kindling the Darkness: A Practical Low-light Image Enhancer(KinD)
  • HALCON数据结构之字符串
  • string模拟优化和vector使用
  • Go-知识依赖GOPATH
  • PyTorch 中 reshape 函数用法示例
  • 安全光幕的工作原理及应用场景
  • 《深度学习》OpenCV LBPH算法人脸识别 原理及案例解析
  • 数据结构之顺序表——动态顺序表(C语言版)
  • Python 网络爬虫入门与实战
  • 成都睿明智科技有限公司电商服务可靠不?
  • fmql之Linux Uart
  • 【火山引擎】调用火山大模型的方法 | SDK安装 | 配置 | 客户端初始化 | 设置
  • 前端实现下载功能汇总(下载二进制流文件、数组下载成csv、将十六进制下载成pcap、将文件下载成zip)
  • iLogtail 开源两周年:UC 工程师分享日志查询服务建设实践案例
  • 【MySQL】入门篇—基本数据类型:NULL值的概念
  • Java设计模式10 - 观察者模式