当前位置: 首页 > news >正文

FFmpeg开发笔记(十四)音频重采样的缓存

FFmpeg在很多地方都运用了缓存机制,比如《FFmpeg开发实战:从零基础到短视频上线》一书的“3.3.2  对视频流重新编码”介绍了编解码的数据缓存,不单是视频编码过程和视频解码过程有缓存,甚至连音频重采样都用到了缓存。
也就是说,重采样函数swr_convert一次只会输出指定长度的音频数据,超出这个长度的数据被留在重采样的缓存当中。那么在对一个音频文件转换格式之时,有可能所有音频帧都遍历完了,重采样缓存里面还保存着剩余未取走的音频数据。此时要像对待视频编码缓存那样,想办法把剩下的音频数据冲出来。
具体到代码实现上,在调用swr_convert函数之时,倒数第二个参数填NULL,表示输入的数据内容为空;倒数第一个参数填0,表示输入的数据大小为0。这便告诉采样器,已经没有要转换的音频了,请把缓存中剩余的数据冲出来吧。那么swr_convert函数的返回值就是本次冲走的输出数据大小,当返回值为0时,表示重采样缓存已经冲光了,再也没有剩余的数据了,此时才能结束音频的格式转换操作。
当然,对于常见的mp3和aac格式,它们每帧的长度是固定的,正常情况调用一次swr_convert函数即可输出完整的音频数据,无需另外处理重采样缓存。只有ogg、amr、wma等格式的每帧音频长度不固定,才需要额外处理音频的重采样缓存,于是对《FFmpeg开发实战:从零基础到短视频上线》一书第五章的重采样代码改动如下。
打开chapter05/swrmp3.c,把下面这行

swr_frame->nb_samples = audio_decode_ctx->frame_size;

改为下面几行(因为ogg、amr和wma的frame_size为0,所以需要另外赋值):

swr_frame->nb_samples = audio_decode_ctx->frame_size;
if (swr_frame->nb_samples <= 0) {swr_frame->nb_samples = 512;
}

另外在轮询数据包的循环结束之后,补充下面的重采样缓存冲刷代码,这样新生成的音频文件才是完整的:

while (1) { // 冲走重采样的缓存(兼容对ogg、amr等格式的重采样)// 重采样。也就是把输入的音频数据根据指定的采样规格转换为新的音频数据输出ret = swr_convert(swr_ctx, // 音频采样器的实例// 输出的数据内容和数据大小swr_frame->data, swr_frame->nb_samples,// 输入内容填NULL、输入大小填0表示冲走缓存NULL, 0);if (ret < 0) {av_log(NULL, AV_LOG_ERROR, "swr_convert frame occur error %d.\n", ret);return -1;} else if (ret == 0) { // 到末尾了break;}save_mp3_file(fp_out, swr_frame); // 把音频帧保存到MP3文件
}

接着执行下面的编译命令。

gcc swrmp3.c -o swrmp3 -I/usr/local/ffmpeg/include -L/usr/local/ffmpeg/lib -lavformat -lavdevice -lavfilter -lavcodec -lavutil -lswscale -lswresample -lpostproc -lm

编译完成后执行以下命令启动测试程序,期望把ring.ogg重采样后保存为MP3文件。

./swrmp3 ../ring.ogg

程序运行完毕,发现控制台输出以下的日志信息,说明完成了对ogg文件重采样mp3音频的操作。

Success open input_file ring.ogg.
audio_decode_ctx frame_size=0, sample_fmt=8, sample_rate=11025, nb_channels=1
audio_encode_ctx frame_size=1152, sample_fmt=6, sample_rate=44100, nb_channels=1
target audio file is output_swrmp3.mp3
Success resample audio frame as mp3 file.

然后打开影音播放器可以正常播放output_swrmp3.mp3,表示上述代码正确实现了将ogg音频数据重采样再转存MP3文件的功能。

http://www.lryc.cn/news/325544.html

相关文章:

  • 详解Python面向对象编程(一)
  • 一文带你完整了解Go语言IO基础库
  • Java基于微信小程序的校园请假系统
  • Expert Prompting-引导LLM成为杰出专家
  • Element-Plus下拉菜单边框去除教程
  • 免费redis可视化工具windows/mac都可以使用,开源免费
  • PHPCMS v9城市分站插件
  • 学习几个地图组件(基于react)
  • 【测试开发学习历程】计算机编程语言
  • 动态内存管理-传值调用错题解析
  • Java特性之设计模式【装饰器模式】
  • Leetcode算法题笔记(2)
  • 二手车交易网站|基于JSP技术+ Mysql+Java+ B/S结构的二手车交易网站设计与实现(可运行源码+数据库+设计文档)
  • lora-scripts 训练IP形象
  • Acwing 503. 借教室
  • 吴恩达深度学习笔记:浅层神经网络(Shallow neural networks)3.1-3.5
  • Linux设备驱动开发 - 三色LED呼吸灯分析
  • 开发者的瑞士军刀:DevToys
  • 【vue3.0】实现导出的PDF文件内容是红头文件格式
  • 【CSP试题回顾】202012-2-期末预测之最佳阈值(优化)
  • docker学习笔记 三-----docker安装部署
  • FastAPI+React全栈开发02 什么是FARM技术栈
  • C#程序结构详解
  • linux 清理空间
  • C语言:给结构体取别名的4种方法
  • 今天聊聊Docker
  • 【C语言】结构体
  • Git基础(24):分支回退
  • 复试专业前沿问题问答合集1
  • C++标准库中提供的用于处理正则表达式的类std::regex