当前位置: 首页 > article >正文

Spring WebFlux 整合AI大模型实现流式输出

前言

最近赶上AI的热潮,很多业务都在接入AI大模型相关的接口去方便的实现一些功能,后端需要做的是接入AI模型接口,并整合成流式输出到前端,下面有一些经验和踩过的坑。

集成

Spring WebFlux是全新的Reactive Web技术栈,基于反应式编程,很适合处理我们需求的流式数据。

依赖

只需要下面这一个依赖即可,但是需要助力springboot父版本,不同的版本在相关的API实现上面有些许的差别。

<dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-webflux</artifactId>
</dependency>

代码

这边我在controller写了一个测试代码,意思是每秒产生一段json数据,一共10次,需要注意,响应头一定要设置text/event-stream 这个值,标志着是流式输出

@GetMapping(path = "/test/chat", produces = MediaType.TEXT_EVENT_STREAM_VALUE)public Flux<String> chatTest() {//chat交互测试return Flux.interval(Duration.ofSeconds(1)).take(10).map(sequence -> "{" + "    \"data\": \"33\"," + "    \"count\": \"" + sequence + "\"" + "}");}

postman 调用接口测试下,正常返回数据了
在这里插入图片描述

后端集成AI大模型

在实际业务中,基本上都是后端来调用 deepseek,再返回给前端,下面大概是集成

public Flux<ServerSentEvent<ObjectNode>> chat() {WebClient webClient = WebClient.create();
String url = "大模型url链接"return webClient.post().uri(url).header("Accept", "text/event-stream").body(BodyInserters.fromObject(reqNode))  // 注意高版本的API 可以直接用 bodyValue().retrieve().bodyToFlux(new ParameterizedTypeReference<ServerSentEvent<ObjectNode>>() {}).log().onBackpressureBuffer().doOnError(throwable -> {//错误处理log.error("chat request error -> {}", throwable.getMessage());throw new RuntimeException("request error -> " +throwable.getMessage());}).doOnNext(v -> {//每次输出流处理log.info("received chat message: {}", v);}).doOnComplete(() -> {//流输出完成处理});

一些错误解决

reactor.core.Exceptions$OverflowException: Could not emit buffer due to lack of requests

报错是由于发布者(Publisher)尝试以比订阅者(Subscriber)请求速率更快的速度推送数据时。这种情况违反了 Reactive Streams 的背压(Backpressure)机制,导致异常抛出。导致流异常终止。
在上面请求时加上了 .onBackpressureBuffer() 用缓冲机制解决

http://www.lryc.cn/news/2402266.html

相关文章:

  • 验证电机理论与性能:电机试验平板提升测试效率
  • Vue.js应用结合Redis数据库:实践与优化
  • Simplicity studio SDK下载和安装,创建工程
  • OpenCV——Mac系统搭建OpenCV的Java环境
  • 更新Java的环境变量后VScode/cursor里面还是之前的环境变量
  • 【设计模式-3.4】结构型——代理模式
  • 电脑频繁黑屏怎么办
  • 50天50个小项目 (Vue3 + Tailwindcss V4) ✨ | Sound Board(音响控制面板)
  • 关于大数据的基础知识(一)——定义特征结构要素
  • chrome使用手机调试触屏web
  • 浅谈量子计算:从实验室突破到产业落地的中国实践
  • 68道Hbase高频题整理(附答案背诵版)
  • python版若依框架开发:项目结构解析
  • 国产linux系统(银河麒麟,统信uos)使用 PageOffice在线编辑word文件保存数据同时保存文件
  • day34- 系统编程之 网络编程(TCP)
  • 鸿蒙jsonToArkTS_工具exe版本来了
  • DeviceNet转Modbus TCP网关的远程遥控接收端连接研究
  • ASP.NET Core 中间件深度解析:构建灵活高效的请求处理管道
  • 开关机、重启、改密、登录:图解腾讯云CVM日常管理核心操作,轻松掌控你的云主机
  • 从0到1认识ElasticStack
  • I2C 外设知识体系:从基础到 STM32 硬件实现
  • vue和uniapp聊天页面右侧滚动条自动到底部
  • 文件索引:数组、二叉树、二叉排序树、平衡树、红黑树、B树、B+树
  • PHP的namespace
  • 《仿盒马》app开发技术分享-- 商品搜索页(顶部搜索bar热门搜索)(端云一体)
  • 10_聚类
  • 网络安全:网页密码防护与记住密码功能的安全
  • Tensorborad
  • Kafka存储机制核心优势剖析
  • day027-Shell自动化编程-基础