当前位置: 首页 > news >正文

阿里mod_asr3.0集成webrtc静音算法

alibabacloud-nls-cpp-sdk-master

先到阿里官网下载nls库的源代码,编译生成对应的库文件和头文件。

我编译的放到了以下目录。

/home/jp/2025/alibabacloud-nls-cpp-sdk-master/build/install/NlsSdk3.X_LINUX/include/

/home/jp/2025/alibabacloud-nls-cpp-sdk-master/build/install/NlsSdk3.X_LINUX/lib/

mod_asr demo

https://download.csdn.net/download/qq_46187594/89714581icon-default.png?t=O83Ahttps://download.csdn.net/download/qq_46187594/89714581下载asr的一个demo,在其中的mod_asr.cpp中调用webrtc静音检测算法,先判断语音静音包,非静音包丢给asr进行识别。

在/home/jp/2025/alibabacloud-nls-cpp-sdk-master/build/install/NlsSdk3.X_LINUX/include目录下mkdir vad目录,用于放后面静音检测的文件代码。

webrtc静音检测

GitHub - cpuimage/WebRTC_VAD: Voice Activity Detector Module Port From WebRTCVoice Activity Detector Module Port From WebRTC. Contribute to cpuimage/WebRTC_VAD development by creating an account on GitHub.icon-default.png?t=O83Ahttps://github.com/cpuimage/WebRTC_VAD/下载这个webrtc静音检测程序,稍微修改下,进行调用。

下载完成后,include目录拷贝到/home/jp/2025/alibabacloud-nls-cpp-sdk-master/build/install/NlsSdk3.X_LINUX/include/vad/下,dr_wav.h,timing.h,

vad.cc也放到/home/jp/2025/alibabacloud-nls-cpp-sdk-master/build/install/NlsSdk3.X_LINUX/include/vod目录下。

main.c修改文件名为windaka.h.

mod_asr集成静音检测

在mod_asr.cpp的asr_callback()方法中增加vadProcess()方法的调用。返回为1表示非静音包,返回不为1表示静音包。特别注意vadProcess()第四个参数为WebRTC_VAD允许设置四个不同级别的敏感度(0-3),其中0最不敏感,3最敏感。

编译mod_asr3.0

编译语句为

g++ -shared -fPIC -O2 -Wall -o mod_asr.so mod_asr.cpp ./vod/*.c -I/home/jp/2025/alibabacloud-nls-cpp-sdk-master/build/install/NlsSdk3.X_LINUX/include -I/home/jp/2025/alibabacloud-nls-cpp-sdk-master/build/install/NlsSdk3.X_LINUX/include/vod  -I/home/jp/2025/alibabacloud-nls-cpp-sdk-master/build/install/NlsSdk3.X_LINUX/include/vod/include  -L/home/jp/2025/alibabacloud-nls-cpp-sdk-master/build/install/NlsSdk3.X_LINUX/lib -lpthread  -lalibabacloud-idst-speech  -ldl -D_GLIBCXX_USE_CXX11_ABI=1 -lrt -lz -ldl -lanl  -I/usr/local/freeswitch/include/freeswitch -L/usr/local/freeswitch/lib -lfreeswitch

编译出来的mod_asr放到/usr/local/freeswitch/mod下,启动freeswitch时手动加载此模块,即可测试静音是否被检测出来。

代码下载
https://download.csdn.net/download/ware_soft/90239465

http://www.lryc.cn/news/519384.html

相关文章:

  • [Git] git pull --rebase / git rebase origin/master
  • Leetcode​​​​​​​3270:求出数字答案
  • 第十一章 施工监测
  • Python爬虫应用领域
  • 软件架构考试基础知识 002:进程的状态与其切换
  • 新车月交付突破2万辆!小鹏汽车“激活”智驾之困待解
  • VideoPlayer插件的功能和用法
  • .NET体系架构
  • QT中引入OpenCV库总结(qmake方式和cmake方式)
  • matlab系列专栏-快捷键速查手册
  • 对于 NestJS + TypeORM 查询构造器分页功能的简单二次封装
  • Kafka消息队列出现消息堆积如何解决
  • LeetCode hot100-100
  • Vue.js:现代前端开发的灵活框架
  • CUDNN详解
  • 下载并安装MySQL
  • Linux ffmpeg 基础用法
  • 【C++入门】详解(中)
  • 深度学习的加速器:Horovod,让分布式训练更简单高效!
  • 计算机的错误计算(二百零八)
  • 海康机器人IPO,又近了一步
  • 【环境搭建】Metersphere v2.x 容器部署教程踩坑总结
  • 系统看门狗配置--以ubuntu为例
  • 阅读笔记——《A survey of protocol fuzzing》
  • C# 语法中级
  • STORM:从多时间点2D图像中快速重建动态3D场景的技术突破
  • excel前缀和(递增求和)
  • 【AI日记】25.01.11 Weights Biases | AI 笔记 notion
  • P8772 [蓝桥杯 2022 省 A] 求和
  • 【Oracle篇】深入了解执行计划中的访问路径(含表级别、B树索引、位图索引、簇表四大类访问路径)