当前位置: 首页 > news >正文

2024.11.03 周报

一 实时超分音频同步问题:

处理方向:

  1. 按照胡学长的办法尝试: 前面处理视频, 将视频中音频提取出来, 将音频每隔 1-2 秒保存为一段 (这样将音频缓存在内存中) , 然后依次播放, 但是音频是44.1KHz采样率,每秒44100次的频率. 每次间隔中程序处理的极短时间也会出现不可在这里插入代码片避免的卡顿现象(人耳可以感觉到极短时间的声音卡顿). 底层全部实现的话,确实是需要一定时间.
  2. 查看ffmpeg 和 ffplay文档
    ffplay -i .\1_output_audio.aac -af "adelay=2000|2000" 使用 -af 参数, 应用音频滤镜,达到延迟效果。
    ffmpeg -i .\1.mp4 -itsoffset 2 -i .\1_output_audio.aac -map 0:v -map 1:a -c:v copy -c:a aac output.mp4 使用-itsoffset 2 参数设置输入时间戳的偏移量, 将输入音频流的时间戳延迟 2 秒。
    ffmpeg 解转码延迟, ffplay播放延迟均是一种可行性方案.

实际效果:

1. 离线视频:

实现一段离线360P视频实时超分+音视频同步,可以在康佳进行演示。

2. 视频流:

视频流中音频延迟稳定播放已经解决。我使用摄像头的视频流模拟实际电视视频流, 实现了音频的5秒延迟(可设置延迟时间),详细说明可见以下博文:

https://blog.csdn.net/SZ170110231/article/details/143449223?fromshare=blogdetail&sharetype=blogdetail&sharerId=143449223&sharerefer=PC&sharesource=SZ170110231&sharefrom=from_link

二 环境部署:

  1. 康佳PC机:部署超分环境,conda,python,torch, ffmpeg等。
  2. RK3588重装系统,从零开始部署了全套环境。

下周计划

  1. 板端整套的代码实现,整个演示系统。
  2. 模型推理优化加速。
http://www.lryc.cn/news/476869.html

相关文章:

  • Oceanbase学习之一迁移mysql数据到oceanbase
  • Milvus - GPU 索引类型及其应用场景
  • Webserver(2.8)守护进程
  • HarmonyOS :
  • C# EF 使用
  • 简介Voronoi图Voronoi Diagrams
  • 硬件测试工程师之EMC项目-辐射抗扰度试验(RS)测试标准解析思维导图
  • H265编码丢帧问题分析
  • CentOS Linux教程(12)--常用编辑器
  • 【浏览器学习笔记】-- 浏览器检查jQuery是否加载
  • 大模型的提示学习
  • 2-143 基于matlab-GUI的脉冲响应不变法实现音频滤波功能
  • 鸿蒙移动应用开发-------前篇
  • ROS(Robot Operating System)中,编写一个记录机器人速度并将其转换成轨迹
  • 了解bootstrap改造asp.net core MVC的样式模板
  • 【C++】对左值引用右值引用的深入理解(右值引用与移动语义)
  • 寻找符合要求的最长子串
  • 【vim文本编辑器gcc编译器gdb调试器】
  • 解决使用Golang的email库发送qq邮件报错short response,错误类型为textproto.ProtocolError
  • 为什么说高级工程师研究的不仅是器件的稳态,模拟器件的开关过程
  • Matlab实现白鲸优化算法(BWO)求解路径规划问题
  • SQLserver索引的优化和使用
  • Linux 安装nacos
  • 水仙花判断
  • 在VS中安装chatGPT
  • 算法笔记:Day-09(初始动态规划)
  • “探索未来医疗:生成式人工智能在医疗领域的革命性应用“
  • 数字IC后端实现Innovus 时钟树综合(Clock Tree Synthesis)典型案例
  • Matlab应用制作入门
  • 什么是声明式编程什么是函数式编程,打比方说明