当前位置: 首页 > news >正文

《语音优先》智能语音技术驱动的交互界面设计与语音机器人设计(译者序)...

“言为心声,语为心境”,语言与对话是我们沟通与协作的重要方式。而智能语音技术是一种基于人工智能和自然语言处理技术的语音交互技术。它可以通过语音识别技术将用户的语音指令转换为文本,然后通过自然语言处理技术对文本进行分析和理解,最终生成相应的响应或执行相应的操作。

虽然智能语音技术由来已久,但直到亚马逊Echo智能音箱的诞生才再一次引发了业界对智能语音技术的广泛关注,因为这样的智能音箱带给了人们一种叫作“语音优先”的用户体验,为用户提供了一种更加便捷、高效的交互方式。

那么,什么是“语音优先”呢?

语音优先是指在设计产品或服务时,将语音交互作为主要的用户界面,以便用户可以通过语音指令来完成操作。这种设计方法可以提高用户的使用体验,特别是双手正在忙碌的场景下,语音交互可以更加方便和快捷。语音优先交互方式的优势在于:

其一是速度,每分钟可以说120-150个字。

其二是释放双手,做饭时通过语音可以完成一些期望做的事。

其三是直觉性,语言是人类的天赋,也是人类交际沟通的自然手段。

其四是同理心,语音中包含了语气、音量、语调和语速,这些特征传达了大量的信息。

智能语音交互离不开人工智能技术,在语音优先交互中所涉及的人工智能技术如下图所示。

fdd3c472f09096e0e11ad38883503299.png 

如今,在为我们服务的智能语音设备背后,有一整套技术和流程,从语音唤醒到自动语音识别,再到自然语言理解,最终通过自然语言生成以及语音合成技术形成反馈,整套流程背后又有很多细分的人工智能技术在支持,如对话管理、深度学习、DNN、CNN、NLP、TTS等。

幸运的是,在2017年,我加入了宣称“All in AI”的百度,负责智能音箱的研发。伙伴们和我经受了88天的炼狱,终于诞生了百度第一款智能音箱Raven-H。而后,还参与了小度音箱、小度在家等产品的研发。后来,作为DuerOS首席布道师负责DuerOS的生态建设。DuerOS开放平台为开发者提供了开发智能语音应用的工具,使智能语音服务的开发更为便利。国外的谷歌与亚马逊,国内的小米、阿里等厂家,也都有着类似于DuerOS开放平台的开发者社区。

开发者在各种语音开放平台上开发智能语音服务的时候,普遍面临着对智能语音交互设计的认知不足的情况,尤其是语音优先设计的适用场景和独特性。作为一名布道师,非常想写一本关于智能语音交互设计与实现方面的书,但由于种种原因,未能成行。

4f8d397a7e5c501148b3e3d2a13b6836.png

本书正是这样一本书,不仅深入浅出地讨论了对话技术,还手把手告诉了我们智能语音交互设计的各种细节,是一本名副其实的设计指南和实战手册。感谢机械工业出版社让我参与了这本书的翻译工作,弥补了自己曾经的遗憾。

翻译团队的诞生源自几个有趣灵魂的碰撞,王同林和卢健作为高级产品经理,强烈的求知欲和十多年丰富的产品设计经验,是他们加入翻译团队的原动力。严谨行文,细心求证,贯穿着我们整个翻译过程。即便如此,仍然如履薄冰,文中不妥之处,欢迎大家斧正。

【关联阅读】

http://www.lryc.cn/news/204208.html

相关文章:

  • [SQL开发笔记]WHERE子句 : 用于提取满足指定条件的记录
  • 【微信小程序】6天精准入门(第5天:利用案例与后台的数据交互)附源码
  • 【Hydro】水文模型比较框架MARRMoT - 包含47个概念水文模型的Matlab代码
  • Android Studio(2022.3.1)设置阿里云源-新旧版本
  • SOLIDWORKS 2024新功能 3D CAD三维机械设计10大新功能
  • 第十三章:L2JMobius学习 – 玩家攻击怪物
  • Module not found: Error: Can‘t resolve ‘core-js/modules/es.promise.js‘
  • 09-React路由使用(React Router 6)
  • Linux上常用网络相关命令
  • contenteditable实现文本内容确认提示
  • vue2vue3--render函数(h)
  • 网络协议--动态选路协议
  • 30天精通Nodejs--第一天:入门指南
  • C# ref用法,实现引用传递(地址传递)
  • 微信小程序数据交互------WXS的使用
  • 【数据结构】String类对象的创建与字符串常量池的“神秘交易”
  • 搞个微信小程序002:个人信息
  • .obj模型文件(带材质和纹理)合并的基本思路
  • es : java 查询
  • MySQL MVCC机制探秘:数据一致性与并发处理的完美结合,助你成为数据库高手
  • 5分钟搞懂分布式可观测性
  • 桥梁结构健康监测系统落地方案
  • hive和presto的求数组长度函数区别及注意事项
  • Kotlin Lambda表达式与标准库中的高阶函数
  • 【JavaEE初阶】 CAS详解
  • Docker镜像制作
  • v-on 可以监听多个方法吗?
  • 【Docker】Docker Compose的使用
  • 2023年中国调速器产量、销量及市场规模分析[图]
  • 深入了解JVM调优:解锁Java应用程序性能的秘诀