当前位置: 首页 > news >正文

AOMedia发布免版税沉浸音频规范IAMF

11月10日,开放媒体联盟(AOMedia)发布了旗下首个沉浸式音频规范IAMF(https://aomediacodec.github.io/iamf/),IAMF是一种编解码器无关的容器规范,可以携带回放时间渲染算法和音频混音的信息,而且和旗下的AV1视频标准一样为免版税。

从AV1开始,AOMedia就在用开放来对抗老牌的标准组织ITU与ISO/IEC的HEVC、VVC等标准。目前,AV1已经成为主流视频平台的主力标准,包括Netflix、Meta、苹果等都在持续扩大AV1的应用部署。同样,IAMF也自然成为对抗商业沉浸式音频方案的主力。目前,业界影响力最大的沉浸式音频解决方案是杜比(Dolby Atmos),苹果就采用了Dolby Atmos作为自身沉浸式音频的解决方案。考虑到杜比在多媒体生产与消费领域拥有全方位的渗透,苹果选择杜比是顺其自然的。此外,全景声科技也是沉浸式音频主要的解决方案商。

AV1的成功在于AOMedia把多媒体各个关键环节的企业拉到了一起,从内容生产侧的工具、内容IP所有者,分发渠道OTT,终端设备商、芯片和关键技术服务商。当然,AV1的成功也得益于HEVC混乱的版税机制的助攻。

9642852b1f218190428fb4e90605c499.jpeg

根据三星发布的新闻稿显示,IAMF项目始于2020年,由三星和Google共同开发,并最终成为AOMedia发布。三星是AOMedia的创始成员。尽管苹果也是AOMedia创始成员,但在自己的生态中依然采用了更加成熟的Dolby Atmos作为沉浸式音频解决方案。AOMedia的成员中还包括Amazon、Meta、微软、Netflix、腾讯、oppo、Vimeo等内容平台方,这些平台的选择将很大程度决定IAMF的命运。

IAMF的关键亮点如下:

适用于所有设备的空间音频:IAMF可以将基于通道和基于场景的全景声空间音频演示无缝传送到包括耳机、移动电话、电视机、家庭影院和网络在内的各种设备上。这种多功能性确保在各个平台上提供一致的高质量音频体验。

灵活的音频传输:IAMF提供了一种灵活的方法,可以将不同类型的音频元素传输到终端设备上。无论是将3.1.2通道音频与立体声音频相结合,IAMF都可以实现。IAMF提供了一种信号渲染算法(例如EAR和BEAR)的方式,以便在扬声器布局和耳机中播放。

创作者友好:创作者可以使用现有的开源插件,如EAR Production Suite,开始创建符合IAMF规范的沉浸式音频内容,该插件包括多扬声器布局和双耳监控的渲染器。IAMF能够携带并包含多个音频混音配置,使创作者和用户能够根据不同的播放偏好进行可控的响度调整。在不久的将来,AOMedia开源参考软件将添加一种IAMF编码工具,用于将各种音频混音压缩为IAMF。

AI驱动:IAMF利用人工智能和深度学习技术来分析场景,并突出内容的某些方面,调整音频水平以增强整个观看体验中的声音效果。使用IAMF技术,用户将能够根据自己的喜好自由调整声音。无论观众想要增强动作场景的音效还是增强对话的清晰度,IAMF都为他们提供了自定义内容音频的灵活性,以实现更个性化的体验。

你可以在这里(https://github.com/AOMediaCodec)找到IAMF规范和参考软件解码器,以及完整的测试流。

据三星研究院视觉技术团队的WooHyun Nam透露,三星研究团队目前正在开发IAMF技术的高级版本,可应用于移动设备、元宇宙、视频游戏等领域。

参考信息:

https://aomedia.org/press%20releases/AOMedia-Advances-the-Audio-Innovation-Era/

https://news.samsung.com/global/interview-movie-quality-audio-from-the-comfort-of-your-home-meet-the-leaders-of-next-generation-3d-audio-technology

c774d72dadfcd1039a805f14da742d9d.png

▼点击下方阅读原文 ▼

进入LiveVideoStackCon 2023深圳站官网 了解更多精彩演讲

http://www.lryc.cn/news/229492.html

相关文章:

  • Linux C 进程编程
  • Spring Boot (三)
  • 第五章:抽象类
  • NSSCTF web刷题记录5
  • Spark SQL 每年的1月1日算当年的第一个自然周, 给出日期,计算是本年的第几周
  • WebSocket Day04 : 消息推送
  • 【Hadoop】MapReduce详解
  • ctf之流量分析学习
  • Linux——vim简介、配置方案(附带超美观的配置方案)、常用模式的基本操作
  • 在线预览编辑PDF::RAD PDF for ASP.NET
  • 【赠书第4期】机器学习与人工智能实战:基于业务场景的工程应用
  • npm封装插件打包上传后图片资源错误
  • [云原生案例2.3 ] Kubernetes的部署安装 【多master集群架构高可用 ---- (二进制安装部署)】
  • 归并排序(含递归和非递归版)
  • 微服务的注册发现和微服务架构下的负载均衡
  • 从混沌到有序:sortedcontainers库的数据魔法改变你的编程体验
  • 读取pdf、docx、doc、ppt、pptx并转为txt
  • 11.13/14 理解SDK框架遇到的问题
  • 计算机网络——b站王道考研笔记
  • Stm32_标准库_18_串口蓝牙模块_手机与蓝牙模块通信_控制LED灯亮灭
  • 低代码与传统开发:综合比较
  • pyqt环境搭建
  • JavaScript数据类型和存储区别
  • Java学习笔记(七)——面向对象编程(中级)
  • 详细推导MOSFET的跨导、小信号模型、输出阻抗、本征增益
  • 循环2作业
  • 一个车厢号码识别算法(2005年的老程序----ccc)
  • 「Verilog学习笔记」优先编码器电路①
  • 解决企业项目管理难题:痛点分析与实用解决方案探索
  • Nginx 简介和安装