当前位置: 首页 > news >正文

Unity 实现与 Ollama API 交互的实时流式响应处理

在当今的游戏开发中,AI 的应用越来越广泛,从简单的对话系统到复杂的智能 NPC。本文将介绍如何使用 Unity 实现一个与 Ollama API 进行交互的应用程序,该应用程序能够接收并处理来自服务器的实时流式响应数据,并将其展示给用户。


🎯 功能概述

本示例展示了如何创建一个简单的 Unity 应用程序,它允许用户输入文本并通过 HTTP POST 请求发送至 Ollama API。应用程序会实时接收返回的数据流,并逐步更新 UI 上显示的内容。以下是具体的功能点:

  • 用户通过 TMP_InputField 输入文本。
  • 点击按钮或按下回车键后,文本会被发送到 Ollama API。
  • 使用 UnityWebRequest 发起异步请求,并通过自定义下载处理器接收流式响应。
  • 数据处理过程中,去除不需要的标记和转义字符,确保最终输出干净整洁。
  • 实时更新 UI 显示内容,提供即时反馈。

🔧 关键代码解析

1. 初始化与事件绑定

void Start()
{if (sendButton != null){sendButton.onClick.AddListener(OnSendButtonClicked);}if (userInputField != null){userInputField.onEndEdit.AddListener(OnInputEndEdit);}if (responseText == null){Debug.LogError("responseText 未赋值!");}else{Debug.Log("responseText 已赋值");}
}

这段代码确保了当用户完成编辑或点击按钮时,相应的事件会被触发,开始处理用户的输入。

2. 发送请求与处理响应

IEnumerator SendPromptToOllamaStream(string prompt)
{var requestJson = new RequestModel{model = "deepseek-r1:7b-Quantization",prompt = prompt,stream = true};string jsonData = JsonConvert.SerializeObject(requestJson);using (UnityWebRequest request = new UnityWebRequest(OLLAMA_URL, "POST")){byte[] bodyRaw = Encoding.UTF8.GetBytes(jsonData);request.uploadHandler = new UploadHandlerRaw(bodyRaw);request.downloadHandler = new CustomDownloadHandler(ProcessStreamChunk); // 自定义下载处理器request.SetRequestHeader("Content-Type", "application/json");yield return request.SendWebRequest();if (request.result != UnityWebRequest.Result.Success){Debug.LogError("请求失败: " + request.error);}else{Debug.Log("请求完成");string finalResponse = currentResponseBuilder.ToString();Debug.Log("最终回复内容: " + finalResponse);if (responseText != null){responseText.text = finalResponse;}}}
}

这里我们构建了一个 JSON 请求体,包含了模型名称、用户输入以及是否启用流式传输的标志位。然后使用 UnityWebRequest 发起 POST 请求,并通过自定义的下载处理器来处理返回的数据流。

3. 处理不完整的 JSON 数据

由于服务器可能分多次返回数据,我们需要一个方法来正确地解析这些片段:

private void ProcessStreamChunk(byte[] data)
{// 解析逻辑...
}

此方法负责拼接所有收到的数据块,直到找到一个完整的 JSON 对象为止,再进行反序列化和进一步处理。

4. 清理响应数据

为了保证输出的整洁性,我们需要对原始响应做一些清理工作:

private string CleanResponseSegment(string segment)
{// 清理逻辑...
}

这一步主要是去除一些不必要的 HTML 标签或其他非预期字符,使得最终展示给用户的文本更加友好。

完整代码

using System;
using System.Text;
using UnityEngine;
using UnityEngine.Networking;
using UnityEngine.UI;
using TMPro;
using System.Collections;
using Newtonsoft.Json;public class OllamaStreamingClient1 : MonoBehaviour
{[Header("UI References")]public TMP_InputField userInputField; // 用户输入框public Button sendButton;             // 提交按钮public TMP_Text responseText;         // 显示回复的文本组件private const string OLLAMA_URL = "http://127.0.0.1:11434/api/generate"; // Ollama API 地址private StringBuilder currentResponseBuilder = new StringBuilder();      // 构建最终回复内容private StringBuilder jsonBuffer = new StringBuilder();                   // 缓冲区,用于拼接不完整的 JSON 数据// ✅ 全局静态变量,用于临时缓存 response 内容public static StringBuilder TempResponseBuilder = new StringBuilder();//  deepseek-r1:7b-Quantizationvoid Start(){if (sendButton != null){sendButton.onClick.AddListener(OnSendButtonClicked);}if (userInputField != null){userInputField.onEndEdit.AddListener(OnInputEndEdit);}if (responseText == null){Debug.LogError("responseText 未赋值!");}else{Debug.Log("responseText 已赋值");}}void OnInputEndEdit(string text){if (text.EndsWith("\n")){OnSendButtonClicked();}}public void OnSendButtonClicked(){string userMessage = userInputField.text.Trim();if (!string.IsNullOrEmpty(userMessage)){Debug.Log($"发送用户输入:{userMessage}");StartCoroutine(SendPromptToOllamaStream(userMessage));userInputField.text = "";userInputField.ActivateInputField();if (responseText != null)responseText.text = "";// ✅ 每次新请求前清空临时缓存TempResponseBuilder.Clear();}}IEnumerator SendPromptToOllamaStream(string prompt){var requestJson = new RequestModel{model = "deepseek-r1:7b-Quantization",prompt = prompt,stream = true};string jsonData = JsonConvert.SerializeObject(requestJson);using (UnityWebRequest request = new UnityWebRequest(OLLAMA_URL, "POST")){byte[] bodyRaw = Encoding.UTF8.GetBytes(jsonData);request.uploadHandler = new UploadHandlerRaw(bodyRaw);request.downloadHandler = new CustomDownloadHandler(ProcessStreamChunk); // 自定义下载处理器request.SetRequestHeader("Content-Type", "application/json");Debug.Log("开始发送请求...");yield return request.SendWebRequest();if (request.result != UnityWebRequest.Result.Success){Debug.LogError("请求失败: " + request.error);}else{Debug.Log("请求完成");string finalResponse = currentResponseBuilder.ToString();Debug.Log("最终回复内容: " + finalResponse);if (responseText != null){responseText.text = finalResponse;}}}}private void ProcessStreamChunk(byte[] data){if (data == null || data.Length == 0) return;string chunk = Encoding.UTF8.GetString(data);jsonBuffer.Append(chunk);while (true){int startIndex = jsonBuffer.ToString().IndexOf('{');if (startIndex == -1) break;int endIndex = FindMatchingBrace(jsonBuffer.ToString(), startIndex);if (endIndex == -1) break; // JSON 不完整,等待下一块string jsonString = jsonBuffer.ToString(startIndex, endIndex - startIndex);try{var responseWrapper = JsonConvert.DeserializeObject<OllamaStreamResponse>(jsonString);if (responseWrapper == null){jsonBuffer.Remove(0, endIndex);continue;}if (!string.IsNullOrEmpty(responseWrapper.response)){string cleanedResponse = CleanResponseSegment(responseWrapper.response);// ✅ 如果清理后的内容是空或为 "<tool_response>",则跳过拼接if (!string.IsNullOrWhiteSpace(cleanedResponse) && !cleanedResponse.Equals("<tool_response>", StringComparison.Ordinal)){TempResponseBuilder.Append(cleanedResponse);}}if (responseWrapper.done){currentResponseBuilder.Clear();currentResponseBuilder.Append(TempResponseBuilder.ToString());UpdateUIText();TempResponseBuilder.Clear(); // 清空全局 buffer}}catch (Exception ex){Debug.LogWarning("JSON 解析失败:" + ex.Message);jsonBuffer.Remove(0, endIndex);continue;}jsonBuffer.Remove(0, endIndex);}}private string CleanResponseSegment(string segment){if (string.IsNullOrEmpty(segment)) return "";// 替换 Unicode 转义字符segment = segment.Replace("\\u003c", "<").Replace("\\u003e", ">");// 去除 <|t|> 类似的标记segment = segment.Replace("<|t|>", "").Replace("|>", "").Replace("<|", "");// 去除 "</think>" 标记(包括可能出现的变体)segment = segment.Replace("<think>", "").Replace("</think>", "")  // 处理可能的 Unicode 或转义形式;    // 可选:处理中文标记return segment.Trim();}private void UpdateUIText(){if (responseText != null){responseText.text = currentResponseBuilder.ToString();Debug.Log("UI 更新为:" + currentResponseBuilder.ToString());}else{Debug.LogWarning("responseText 为 null,无法更新 UI!");}}private int FindMatchingBrace(string str, int start){int depth = 1;for (int i = start + 1; i < str.Length; i++){if (str[i] == '{') depth++;else if (str[i] == '}') depth--;if (depth == 0){return i + 1; // 包含最后的 }}}return -1;}[Serializable]private class RequestModel{public string model;public string prompt;public bool stream;}[Serializable]private class OllamaStreamResponse{public string model;public string created_at;public string response;public bool done;public string done_reason;}}

 


📦 扩展与优化建议

1. 增加错误处理机制

可以在每个可能出错的地方添加更详细的错误处理逻辑,比如网络超时、无效的 JSON 格式等。

2. 改进用户体验

可以考虑增加加载动画或提示信息,让用户知道请求正在处理中。

3. 性能优化

对于频繁的 UI 更新操作,可以考虑批量更新以减少渲染开销。


📖 结语

通过上述步骤,我们已经成功实现了一个基于 Unity 和 Ollama API 的简单但功能强大的聊天机器人前端。希望这篇博客能够帮助你快速上手相关技术,并激发你在自己的项目中尝试更多创新的可能性!

http://www.lryc.cn/news/581883.html

相关文章:

  • 图解函数调用过程(函数栈帧)
  • MongoDB与Spring Boot完整使用指南
  • windows grpcurl
  • Python脚本保护工具库之pyarmor使用详解
  • Rust 所有权系统:深入浅出指南
  • Linux运维安全新范式:基于TCPIP与SSH密钥的无密码认证实战
  • Vite 常用配置详解
  • 嵌入式数据库sqlite测试程序
  • 数据结构之树,二叉树,二叉搜索树
  • Chatbox➕知识库➕Mcp = 机器学习私人语音助手
  • C++ --- list的简单实现
  • 当“漏洞”成为双刃剑——合法披露与非法交易的生死线在哪里?
  • javaweb———html
  • 系统性红斑狼疮治疗靶点CD303
  • 1. http 有哪些版本,你是用的哪个版本,怎么查看
  • 在Ubuntu主机中修改ARM Linux开发板的根文件系统
  • RSTP 拓扑收敛机制
  • IRF堆叠技术的主要优势
  • 操作系统王道考研习题
  • HCIA-生成数协议(STP)
  • uniapp实现的多种时间线模板
  • DolphinScheduler 3.2.0 后端开发环境搭建指南
  • Vue计算属性(computed)全面解析:原理、用法与最佳实践
  • 多级缓存如何应用
  • C++高频知识点(二)
  • 【Pyhton】文件读取:读取整个(大型)文件
  • 铸造软件交付的“自动驾驶”系统——AI大模型如何引爆DevOps革命
  • mybatis-plus从入门到入土(二):单元测试
  • 深度学习图像分类数据集—蘑菇识别分类
  • 利用近距离全景图像进行树状结构骨架化