当前位置: 首页 > news >正文

基于express调用chatgpt文字流输出和有道智云语音合成

express是基于node.js的一个web框架,可以更加简洁的去创建一个后台服务,由于项目的需要,引入和typescript,经过几天的努力实现了chatgpt文字流输出+有道智云语音合成的结合(略有遗憾),下面我记载以下,以供参考

后端实现:

    要出现chatgpt原生接口的流式效果(也就是一个字一个字往外面蹦),就得只能使用SSE(event-stream)和Websocket,其实采用轮询(短轮询和长轮询)也是可以的只是占用资源,下面我先来介绍这记得交互方法

  • 轮询:是由客户端每隔一段时间向服务器发出HTTP请求,服务端接收到请求后向客户端返回最新的数据。
    客户端的轮询方式一般分为短轮询和长轮询。

    • 短轮询:一般是由客户端每隔一段时间向服务器发起一次普通HTTP请求。服务端查询当前接口是否有数据更新,若有数据更新则向客户端返回最新数据,若无则提示客户端无数据更新。
      优点:比较简单,通过定时器在固定的间隔里不断发送请求。
      缺点:多条请求并不是每条都是有用的,会有很多无用请求,占据服务器资源和宽带,并且维护困难,响应的结果没有顺寻(因为是异步请求)只适用与小型应用。

    • 长轮询:一般是由客户端向服务器发出一个设置较长网络超时时间的HTTP请求,并在Http连接超时前,不主动断开连接;带颗段超时或有数据返回后,再次建立一个同样的Http请求,重复以上过程。
      优点:无消息时不会频繁请求,占用资源较少。
      缺点:服务器滞留信息会耗费资源,返回信息顺序无法保证,维护困难。

  • SSE(event-stream):SSE(Server-Sent Events)是一种单向通信协议,其中服务器可以将消息推送到客户端。与轮询不同,客户端只需发送一个请求,服务器可以随时发送新消息。这种方法可以减少网络流量和服务器负载。

  • Websocket:WebSocket 是一种双向通信协议,它允许服务器和客户端在连接打开的情况下实时通信。WebSocket 可以减少网络流量和服务器负载,因为它不需要客户端发送大量的 HTTP 请求来获取新消息。

可以看出SSE和Websocket两种协议在实时通讯中起着很大作用,下面介绍这两种协议在express的应用:

SSE:
import { Stream } from 'node:stream';
import api from '../ToolClass/base.js'
async function sendTextBymodel1(req,res){const params=res.data   //获取前端传过来的数据,其中包含一个属性Stream,要设置为trueconst {data}=await api.post<Stream>("/v1/chat/completions",params,{responseType:"stream"})res.send(readStream(data))   //这里进行对返回值的处理,可以在前端处理
}
function readStream(decoded) {let response=""let decodedArray = decoded.split("data: ");let longstr = "";decodedArray.forEach(decoded => {try {decoded = decoded.trim();if ( longstr == "" ){JSON.parse(decoded);}else{decoded = longstr + decoded;longstr = "";JSON.parse(decoded);}}catch ( e ){longstr = decoded;decoded = "";}if(decoded!==""){if(decoded.trim()==="[DONE]"){return;}else{response = JSON.parse(decoded).choices[0].delta.content ? JSON.parse(decoded).choices[0].delta.content : ""   return response}}})return response
}
export {sendTextBymodel1}

 返回的就是一个一个字符

前端通过fetch或者EventSource来进行接收,对于普通的浏览器还是行的,不过使用在uniapp中打包成安卓就不行了,此时的解决方案就是Websocket:

下载包:

npm i express-ws

注入,使用:

import expressWs from 'express-ws'
import {sendTextBymodel1} from './Controller/ChatAI.js'
const app=express()
expressWs(app)
app.ws("/chat",sendTextBymodel1)import { Stream } from 'node:stream';
import api from '../ToolClass/base.js'
async function char(params,ws){ /* <Stream> */try {// speecher("有道词典API使有道词典API使有道词典API使有")const {data}=await api.post<Stream>("/v1/chat/completions",JSON.parse(params),{responseType:"stream"})data.on("data", async (dat)=>{ await ws.send(dat.toString('utf8'))})data.on('close',async () => {await ws.close();});} catch (error) { ws.send({status:402,meaasge:"Websocket服务出现错误"})}
}function sendTextBymodel1(ws,res){// 使用 ws 的 send 方法向连接另一端的客户端发送数据// ws.send("connect to express server with WebSocket success")let flag=falsews.on("message",async (msg)=>{char(msg,ws)})ws.on("close",(e)=>{})
}
export {sendTextBymodel1}

前端实现:

uni.connectSocket({url:"ws://43.155.177.34:8085/chat",header: {'content-type': 'application/json'}
})
uni.onSocketOpen((res)=>{uni.sendSocketMessage({data: param});
});
uni.onSocketError((res)=>{console.log('WebSocket连接打开失败,请检查!');});
uni.onSocketMessage((res)=>{this.readStream(res.data,_this, currentResLocation,"chat");  //与上面SSE的后端代码方法一样
})

关于有道智云语音合成API的代码如下:

import axios from 'axios'
import { generateUUID } from './util.js'
import { config } from 'dotenv';
import crypto from 'crypto'
import id3 from 'node-id3'
import fs from 'fs'
config()
const setting={q:"",appKey:"",salt:"",sign:"",signType:"v3",curtime:"",voiceName:"youxiaoqin",format:"mp3"
}
async function speecher(q:string){initData(q)const response=await axios.post("https://openapi.youdao.com/ttsapi",setting,{headers:{'Content-Type': 'application/x-www-form-urlencoded',},responseType: 'arraybuffer'})let name=Math.floor(Date.now() / 1000)let outputFilePath = 'public/'+name+'.mp3';try {fs.writeFileSync(outputFilePath,response.data,'binary');// const tags = id3.read(outputFilePath);// const durationInSeconds = tags && tags.duration ? tags.duration : 0;// console.log(durationInSeconds);} catch (error) {console.log(error);}return outputFilePath
}function calculateSHA256(input) {const hash = crypto.createHash('sha256');hash.update(input);return hash.digest('hex'); // 返回十六进制表示的哈希值
}function initData(q){setting.q=Buffer.from(q, 'utf8').toString();setting.appKey="应用key"let salt=generateUUID()setting.salt=saltsetting.voiceName="youxiaoqin"setting.curtime=Math.floor(Date.now() / 1000).toString()let input=getInput(q)const hashedData = calculateSHA256("应用key"+input+salt+setting.curtime+"应用秘钥");setting.sign=hashedDatasetting.signType="v3"
}function getInput(q){if (q.length<=20) {return q}return q.slice(0, 10)+q.length+q.slice(-10)}
export default speecher
export function generateUUID() {let d = new Date().getTime();let uuid = 'xxxxxxxx-xxxx-4xxx-yxxx-xxxxxxxxxxxx'.replace(/[xy]/g, function(c) {let r = (d + Math.random() * 16) % 16 | 0;d = Math.floor(d / 16);return (c === 'x' ? r : (r & 0x3 | 0x8)).toString(16);});return uuid;
}
export const AI_HEAD_IMG_URL="https://th.bing.com/th?id=ODL.3e2fbff4543f0d3632d34be6d02adc93&w=100&h=100&c=12&pcl=faf9f7&o=6&dpr=1.5&pid=13.1"

其中有些变量可以不使用硬编码的形式,express可以使用环境变量,使用dotenv包

整个demo做下来,本想做成流式输出文字将文字流传给流式合成语言,然后将语言传给前端,达到实时对话,但是网上找了一遍支持流式语音的API都是国外的谷歌、微软、亚马逊,但是这些调用其API需要进行注册,注册过程中需要用到国外信用卡,悲痛,国内支持的流式传输的有百度,阿里的,只是是百度和阿里的声音比较简单,所以就没做了

本文参考了:

短轮询和长轮询_长轮询和短轮询_白鲸ld的博客-CSDN博客

http://www.lryc.cn/news/101329.html

相关文章:

  • (学习笔记-内存管理)内存分段、分页、管理与布局
  • PHP使用Redis实战实录1:宝塔环境搭建、6379端口配置、Redis服务启动失败解决方案
  • 【数据结构】这堆是什么
  • FFmpeg 音视频开发工具
  • Go 语言 select 都能做什么?
  • Hive之窗口函数lag()/lead()
  • Vite+Typescript+Vue3学习笔记
  • 二、SQL-6.DCL-2).权限控制
  • [OpenStack] GPU透传
  • 无涯教程-jQuery - Progressbar组件函数
  • [SQL挖掘机] - 窗口函数 - rank
  • VBAC多层防火墙技术的研究-状态检测
  • PHP8的数据类型-PHP8知识详解
  • 明晚直播:可重构计算芯片的AI创新应用分享!
  • flask 点赞系统
  • 关于Java的多线程实现
  • 如何判断某个视频是深度伪造的?
  • ESP32(MicroPython) 四足机器人(一)
  • 力扣刷题记录---利用python实现链表的基本操作
  • OpenAI重磅官宣ChatGPT安卓版本周发布,现已开启下载预约,附详细预约教程
  • PHP 支付宝支付、订阅支付(周期扣款)整理汇总
  • python-pytorch基础之神经网络回归
  • linux中通过.desktop文件执行bash命令打开chrome浏览器并传参
  • ChatGPT的应用与发展趋势:解析人工智能的新风口
  • 使用maven打jar包时,如何只把依赖的其它jar中的类打进jar包,没有依赖的其它jar包的类文件不打进来?
  • arm neon/fpu/mfloat
  • Maven基础之项目创建、packaging
  • c++ std::map 使用注意事项
  • Camera HAL/ISP 专业术语大全
  • POI的简单入门