当前位置: 首页 > news >正文

论文阅读|汽车虚拟环绕音响系统设计与实现策略的比较研究

《Comparative Study of Design and Implementation Strategies of Automotive Virtual Surround Audio Systems》

一、摘要

针对汽车虚拟环绕声的各类设计与实现策略,开展了一项综合性研究。如今,多声道视听系统在汽车中的应用日益增多。然而,由于密闭空间内的反射、非理想的用户 / 扬声器位置以及环境噪声,汽车内部向来是出了名的恶劣听音环境。因此,开发能够在车载严苛环境中还原高质量空间声场的音频系统十分必要。

针对 双声道 和 5.1 声道 输入,研究提出四种设计方案:

  • 双声道输入场景
    ① 提出 “基于混响的上混频 + 逆滤波” 方法;
    ② 提出 “带加权和延迟的上 / 下混频” 方法(上混频用于将双声道信号转换为四声道信号,下混频则实现反向转换;逆滤波器用于依据 5.1 声道布局 定位虚拟声像)。

  • 5.1 声道输入场景
    ① 提出 “逆滤波结合下混频” 方法;
    ② 提出 “带加权和延迟的下混频” 方法。

上述处理算法已在实车上完成 实际部署。通过 仿真与实验 验证了所提空间音频系统的性能,并开展 主观听音测试,借助 多变量方差分析(MANOVA) 对各方法的数据进行对比。实验结果表明:

  • 逆滤波在 单乘客模式 下效果最优(尤其适用于后排座椅);
  • 若乘客数量超过一人,从 声场还原性能 与 计算复杂度 综合考量,替代方法(如加权延迟法)更具优势。

术语补充说明:

  • 上混频(Upmixing):将少声道信号转换为多声道信号;
  • 下混频(Downmixing):将多声道信号转换为少声道信号;
  • MANOVA:Multivariate Analysis of Variance(多变量方差分析,用于多指标数据的统计对比)。

二、背景

由于封闭空间内的反射、不理想的用户 / 扬声器位置以及环境噪音,(汽车内部)成为了众所周知的糟糕听音环境。这促使当前研究致力于开发汽车音频空间化器,以为车辆创造合适的听音环境。除了传统的多通道声像定位技术 [1],空间音频渲染还有两种先进方法:双耳音频 [2]-[15] 和波场合成(WFS)[16]-[19]。

双耳音频通常针对使用一对立体声扬声器的单个用户。然而,这种方法存在所谓 “最佳听音点” 范围有限的问题,即系统仅在该区域内有效 [10]-[15]。另一方面,波场合成技术理论上不受 “最佳听音点” 问题的限制,听众可以在重放区域内自由移动。尽管学术界对波场合成技术已有大量研究,但其尚未得到广泛的商业应用。关键问题在于,该方法需要大量扬声器,进而导致处理过程复杂,这限制了其在实际系统中的应用。本研究将提出一种介于双耳音频和波场合成之间的实用方法作为折中方案


三、理论与数值模拟

本节将回顾多声道逆滤波器的设计流程,然后介绍等效复平滑技术,最后讨论采用自由场点源模型的最佳听音点分析。

3.1 从模型匹配视角看多声道逆滤波

在这个空间音频问题中,多声道逆滤波器有两个作用:一是对房间响应进行 “去混响”,二是按照标准的 5.1 声道配置定位虚拟声像 [27]。

模型匹配的核心视角:将逆滤波问题转化为 “模型匹配” 问题,通过框图(图 1)展示了信号处理的逻辑:输入信号x(z)经逆滤波器矩阵C(z)处理后生成扬声器输入v(z),再通过房间传递矩阵H(z)形成实际声场;目标是使实际声场与理想的匹配模型M(z)尽可能接近,通过最小化误差信号e(z)实现模型匹配。

3.2 等效复平滑技术

由于实测房间响应具有高度复杂的动态特性且存在相关测量误差,基于此实现逆滤波器既不切实际且鲁棒性较差 [30]。在设计逆滤波器之前,应进行一些预处理。一种简单而巧妙的方法是,采用 Hatziantoniou 和 Mourjopoulos 提出的广义复平滑技术 [31],对声学设备的频率响应峰谷进行平滑处理。

复平滑的实现方法有两种:

第一种是均匀平滑,即通过频率响应的逆快速傅里叶变换(FFT)计算脉冲响应,然后施加时域窗对脉冲响应进行截断和渐缩,这实际上会平滑频率响应,最后通过对修改后的脉冲响应进行快速傅里叶变换(FFT),得到 “平滑后的” 频率响应。

此外,还可采用非均匀平滑方法。该方法直接在频域进行平滑处理。

3.3 最佳听音点分析

最佳听音点分析按如下方式进行:为简化分析,忽略边界的反射,并将扬声器视为点声源。自由场点源模型如图 2 所示,图中标示了四个座位处的四个控制点以及四个扬声器的位置。声学传递矩阵可写为:

匹配模型矩阵 M 通过计算控制点与待定位的虚拟声像之间的距离构建而成。逆滤波器 C 通过使用前述的逆滤波器设计流程得到。匹配模型矩阵 M 与多声道滤波器 - 设备乘积 HC 之间的误差(通过 2 - 范数衡量)被定义为最佳听音点的性能指标。Ep (x, y) 的值越小,性能就越好。

四、汽车音频空间化的设计策略

在本节中,汽车音频空间化器的设计策略将分为两类进行介绍。一类是双声道内容,如 CD、MP3 和无线电广播,这些在普通汽车中较为常见。另一类是 5.1 声道内容,如 DVD 和数字视频广播(DVB),这类内容已逐渐普及。

汽车环绕声的核心问题在于,如何在封闭空间内存在反射、且听者与扬声器位置不当的情况下,渲染出空间声场。

本文提出四种方法,见表2。

4.1 两通道输入

在传统汽车音频中,左声道输入信号被输送到左前和左后扬声器,右声道输入信号被输送到右前和右后扬声器。通常可以调节左右以及前后的平衡。这种方法的问题在于,前后声道的相关性过高,无法营造出自然的环绕声效果。本文旨在开发上混算法,将双声道输入扩展为四声道。

上混通常可通过两类方法实现。一类是使用基于去相关的方法,例如 Prologic II 和 Logic 7。另一类是基于混响的方法,研究发现其在营造空间感方面非常有效,尤其在小空间中 [32]。在之前的主观听觉测试中 [33],在环境环绕效果方面,基于混响的方法优于基于去相关的方法。因此,下文讨论中仅采用基于混响的上混方法。

4.1.1 方法一:结合逆滤波的上混

方法一的框图如图6所示,其中双声道输入信号通过基于混响的上混算法扩展为四声道,然后经逆滤波处理得到输出信号。采用人工混响器生成后环绕声道。该人工混响器由三个并行梳状滤波器(如图7(a)所示)和一个三层嵌套全通滤波器(如图7(b)所示)构成。该网络中的参数通过遗传算法(GA)进行调谐[32]。将左右输入信号的差值混入后声道以增强环境感,且左后与右后声道设置为180°异相。

4.1.2  方法二:结合延迟与加权的上混 / 下混

方法一的逆滤波适用于单个乘客。如果乘客坐在不同的座位上,就必须重新设计逆滤波器。如前所述,标称设计位置处的最佳听音点极小。随着乘客数量的增加,计算量也会增大。 为解决与逆滤波相关的这些问题,开发了方法二作为汽车环绕声问题的替代解决方案。

图8展示了方法二的框图,其中需要进行串联的上混和下混处理。本研究中使用了加权(0.65)和延迟(20毫秒)。方法二中的上混模块本质上与方法一中的相同。对于上混后的信号,仅通过标准的加权和求和进行下混,以生成双声道输出。与逆滤波方法相比,方法二的计算需求更低,且适用于多乘客聆听场景

4.2 5.1通道输入

本节将介绍另一类汽车环绕声处理器,这类处理器接收来自DVD播放器中杜比数字(Dolby Digital)或DTS解码器的5.1声道输入信号。

4.2.1 方法三:逆滤波

图9所示的方法III的结构与方法I相同,只是不需要上混处理。鉴于存在5.1声道输入和四个扬声器,中置声道在混入左前和右前声道之前必须进行衰减。接下来,前两个声道和后两个声道被输送到各自的逆滤波器中。

4.2.2 方法四:结合延迟与加权的下混

与方法二类似,方法四是一种下混算法,针对5.1声道格式的输入而开发,其框图如图10所示。在该方法中,中置声道首先被混入前两个声道,随后同侧声道被求和以生成两个前声道。接下来,前声道经过加权和延迟处理以生成后声道。与方法三类似,在假设超低音扬声器不可用的情况下,剩余的低频效果声道(LFE)被混入每个扬声器。 与方法二类似,与逆滤波方法相比,方法四的计算需求更低,且适用于多乘客聆听场景

五、结论

第一,对于双声道输入,方法 I 优于方法 II,尤其是在后座,且两者均优于隐藏参考。

第二,对于 5.1 声道输入,方法 III 在大多数属性上得分最高,尤其是在空间属性方面。此外,方法 III 在后座的前方声像和近场感表现上优于前座。

第三,对于单乘客模式,综合考虑渲染性能和计算复杂度,双扬声器方案是更优选择。

第四,逆滤波在双乘客模式下的表现不如在单乘客模式下。此外,逆滤波器的数量随乘客数量急剧增加。

论文链接https://www.researchgate.net/publication/290197393_Comparative_Study_of_Design_and_Implementation_Strategies_of_Automotive_Virtual_Surround_Audio_Systems

http://www.lryc.cn/news/583254.html

相关文章:

  • OpenCV图片操作100例:从入门到精通指南(4)
  • NLP:初识RNN模型(概念、分类、作用)
  • 继承与多态:面向对象编程的两大支柱
  • stockapi股票实时tick数据,技术指标macd,kdj,cci,日k线数据
  • 如何将FPGA设计的验证效率提升1000倍以上(3)
  • oracle ocp题库有多少道题,以及题库背诵技巧
  • JavaEE初阶第八期:解锁多线程,从 “单车道” 到 “高速公路” 的编程升级(六)
  • 软件设计师中级概念题
  • Selenium+Pytest自动化测试框架实战前言#
  • 汽车工业制造领域与数字孪生技术的关联性研究​
  • Microsoft AZ-305 Exam Question
  • 迁移Oracle SH 示例 schema 到 PostgreSQL
  • 亚马逊广告进阶指南:长尾词应如何去挖掘
  • RapidRAW RAW 图像编辑器
  • 游戏开发学习记录
  • 码云创建分支
  • 分库分表之实战-sharding-JDBC绑定表配置实战
  • 掌握PDF转CAD技巧,提升工程设计效率
  • 模型内部进行特征提取时,除了“减法”之外,还有哪些技术
  • Android ttyS2无法打开该如何配置 + ttyS0和ttyS1可以
  • BEV感知算法:自动驾驶的“上帝视角“革命
  • c语言学习_函数递归2
  • 深度学习模型在C++平台的部署
  • Spring Boot微服务中集成gRPC实践经验分享
  • 1️⃣理解大语言模型
  • 百度文心一言开源ERNIE-4.5深度测评报告:技术架构解读与性能对比
  • Shell 脚本0基础教学(一)
  • 【计算机组成原理——知识点总结】-(总线与输入输出设备)-学习笔记总结-复习用
  • Energy-Based Transformers:实现通用系统2思维的新范式
  • HOOPS Communicator 2025.5.0版本更新速览:性能、测量与UI全面优化