当前位置: 首页 > news >正文

Elasticsearch:虚拟形象辅助和对话驱动的语音到 RAG 搜索

作者:来自 Elastic Sunile Manjee

搜索的演变

搜索已经从产生简单结果的简单文本查询发展成为容纳文本、图像、视频和问题等各种格式的复杂系统。

如今的搜索结果通过生成式人工智能、机器学习和交互式聊天功能得到增强,提供更丰富、更动态且与上下文相关的用户体验。 不久前的搜索由文本查询和相关结果组成。

与你的数据对话,这是自然的

在对话支撑每一次互动的领域中,无论是与人类还是机器人,我们的搜索体验难道不应该反映这一基本方面吗? 想象一下企业内存在大量的公司文档。 自然地,这种环境会激发好奇心和大量问题,从而引发后续询问。 这种与生俱来的人类特质驱使我们寻求答案,根据最初的反应进行更深入的研究,并不断探索。 然而,传统的问答机制存在缺陷,因为它们经常忽视先前交流的背景,导致整个过程脱节且费力,感觉不自然,并促使用户过早退出。

超越问答

考虑使用电视搜索内容的行为,例如搜索尼古拉斯·凯奇主演的动作电影。 虽然大多数当前系统都能熟练地提供相关结果,但查询很少就此结束。 后续的问题,例如询问这些电影的运行时间或上映日期,是我们寻求信息的自然过程。 然而,标准搜索应用程序并不是为了促进持续对话而设计的; 它们是围绕孤立的问答格式构建的,这限制了交互和探索的深度。

与虚拟形象对话

这就是虚拟形象辅助搜索体验的概念发挥作用的地方,特别是在用户(包括我自己)更喜欢直接答案而无需筛选信息的情况下。 有时,我们希望能够方便地获得答案,而无需费力阅读内容。 开发用于生成响应的化身可以进一步使这种交互现代化,提供更具吸引力、更高效和更自然的用户体验。

Live Demo

在 Elasticsearch 中使用向量搜索驱动的机器学习动态分面

整合详情

语音转搜索

高级搜索体验始于用户语音交互,这些交互通过 Azure Speech to Text 转换为文本,形成搜索查询的基础。 然后,使用 ELSER 通过 Elasticsearch 处理该查询,以检索相关文档,例如列出 “action movies featuring Nicolas Cage - 尼古拉斯·凯奇主演的动作电影” 的电视指南。 这确保了搜索结果的准确性和相关性。

RAG 和缓存

在增强的搜索框架中,仅仅获取文档是不够的。 Azure OpenAI 的 GPT-4 将原始数据提炼为可理解的响应,确保对话流程顺畅。 此外,Elasticsearch 作为 GenAI 缓存层提高了效率,回收相关查询的答案,从而节省资源。 例如,如果有 “action movies featuring Nicolas Cage - 尼古拉斯·凯奇主演的动作电影” 的缓存响应,缓存 API 将迅速将其用于 “Nicolas Cage high-intensity movies - 尼古拉斯·凯奇高强度电影” 等类似问题,从而加速搜索体验。

虚拟形象响应生成

由 Azure Synthesizer 提供支持的虚拟形象响应功能进一步丰富了体验,添加了超越传统基于文本的界面的视觉和审核维度。 这创造了更具吸引力和交互性的用户体验,集成了各种先进技术以提供动态、直观和引人注目的搜索体验。

概括

从传统的 Google 搜索到 ChatGPT 等平台来回答查询的转变说明了一个更广泛的趋势:我们更喜欢对话而不是静态信息检索。 这种偏好强调了企业在搜索功能中采用更直观和对话式方法的重要性。 通过采用这种范式,企业可以更好地适应人类对话的自然倾向,从而增强其数据生态系统内的整体搜索和发现过程。

演示资源

仍然好奇,这是源代码的链接。

http://www.lryc.cn/news/326989.html

相关文章:

  • 测试开发工程师(QA)职业到底需要干些什么?part7:硬件测试工程师QA
  • Python基础:标准库 -- pprint (数据美化输出)
  • Visual Studio 小更新:改善变量的可见性
  • C++自主点餐系统
  • jconsole jvisualvm
  • python vtkUnstructuredGrid 转 vtkAlgorithmOutput_
  • IS-IS路由
  • 打造新质生产力,亚信科技2024年如何行稳致远?
  • 开源博客项目Blog .NET Core源码学习(12:App.Application项目结构分析)
  • AES加密解密算法
  • 计算机网络(05)
  • 6、ChatGLM3-6B 部署实践
  • python面试题(1~10)
  • 分类预测 | Matlab实现CNN-LSTM-Mutilhead-Attention卷积神经网络-长短期记忆网络融合多头注意力机制多特征分类预测
  • SQLServer CONCAT 函数的用法
  • python快速入门一
  • Elasticsearch 面试题及参考答案:深入解析与实战应用
  • 【ARM 嵌入式 C 入门及渐进 18 -- 字符数字转整形函数 atoi 介绍】
  • 全国超市数据可视化仪表板制作
  • react native 总结
  • 什么是自然语言处理(NLP)?自然语言处理(NLP)的概述
  • 共享旅游卡怎么使用?共享旅游卡的奥秘与魅力,解锁高效旅行的新方式
  • 使用yolov9来实现人体姿态识别估计(定位图像或视频中人体的关键部位)教程+代码
  • 「14」四个步骤,让你在直播间轻松演义你的教案……
  • 分解质因子
  • iOS18系统中,苹果可能不再使用Siri,转用Gemini
  • python笔记进阶--模块、文件及IO操作(1)
  • 单元测试框架 Junit
  • 数电票怎么查询真伪|发票识别接口|发票查验接口|PHP接口文档
  • 外包干了一个月,忘记Git怎么使用了...