当前位置: 首页 > news >正文

Deep4SNet: deep learning for fake speech classification

Deep4SNet:用于虚假语音分类的深度学习
摘要:
虚假语音是指即使通过人工智能或信号处理技术产生的语音记录。生成虚假录音的方法有"深度语音"和"模仿"。在《深沉的声音》中,录音听起来有点合成,而在《模仿》中,录音听起来很自然。另一方面,考虑到在互联网上传输的大量语音记录,检测虚假内容的任务并不微不足道。
为了检测通过深度语音和模仿获得的虚假语音,我们 提出了一种基于卷积神经网络( Convolutional Neural Network,CNN )的解决方案,使用图像增强和Dropout。所提出的架构使用2092个原始和虚假语音记录的直方图进行训练,并使用864个直方图进行交叉验证。使用476个新直方图进行外部验证,并计算准确率( Precision,P )和召回率( Recall,R )。对模仿型探究录音的 检测达到了P = 0.997,R = 0.997,对Deep Voice-based录音的检测达到了P = 0.985,R = 0.944。全局精度为0.985。根据结果,所提出的系统在检测虚假语音内容方面是成功的。
结论:
  • Deep4SNet在检测模仿和Deep Voice生成的伪造语音方面表现出色,整体准确率达到0.985。
  • 通过对比手工特征和自动特征提取方法,论文发现自动特征提取(使用直方图图像)更适合于伪造语音检测任务。
  • 通过图像增强和dropout技术,模型在防止过拟合方面表现出良好的鲁棒性。
背景
  • 伪造语音问题 :随着人工智能和信号处理技术的发展,伪造语音变得越来越逼真。伪造语音可能用于欺骗、误导或作为虚假证据,尤其是在法律领域,因此检测伪造语音具有重要意义。
  • 现有方法:传统的语音验证方法主要依赖于高斯混合模型(GMM)和通用背景模型(UBM)。近年来,基于遗传算法(GA)、蚁群优化(ACO)、支持向量机(SVM)和深度学习(DL)的方法也被提出用于语音验证和伪造语音检测。
内容成果
  • 研究方法
论文提出了一种基于卷积神经网络(CNN)的伪造语音检测模型,称为Deep4SNet。该模型使用图像增强和dropout技术来提高检测性能。
模型训练使用了2092个直方图,这些直方图来自原始语音和伪造语音录音。此外,还使用了864个直方图进行交叉验证,以及476个新的直方图用于外部验证。
论文比较了手工特征提取和自动特征提取两种方法。手工特征提取依赖于统计值和熵等特征,而自动特征提取则通过将语音信号转换为直方图图像来实现,将问题转化为计算机视觉问题。
Deep4SNet的网络结构相对简单,包含3个卷积+池化层,后接一个展平层、一个隐藏层和输出层。隐藏层中使用了dropout来防止过拟合。
  • 实验
实验设置:实验使用了基于模仿方法和Deep Voice算法生成的原始和伪造语音录音。数据集被平衡地分为训练集和验证集。
评价指标:使用准确率、损失、精确率和召回率等指标来评估模型性能。
过拟合策略:通过图像增强(水平翻转)和dropout来避免过拟合。实验结果表明,dropout率为0.2时模型性能较好。
外部测试:使用400个新的录音(20个原始录音和380个伪造录音)进行外部测试。测试结果显示,模型在检测模仿方法生成的伪造语音时精确率为0.997,召回率为0.997;在检测Deep Voice生成的伪造语音时精确率为0.985,召回率为0.944。
贡献点:
提出了一种基于深度学习的伪造语音检测方法,能够有效区分原始语音和通过模仿及Deep Voice技术生成的伪造语音。
http://www.lryc.cn/news/521584.html

相关文章:

  • 3 前端: Web开发相关概念 、HTML语法、CSS语法
  • SpringBoot工程快速启动
  • Unity WebGL:本机部署,运行到手机
  • 【线性代数】行列式的概念
  • Android SystemUI——StatusBar视图创建(六)
  • Picocli 命令行框架
  • spring-cloud-starter-gateway 使用中 KafkaAppender的问题
  • 【全套】基于分类算法的学业警示预测信息管理系统
  • Elasticsearch Python 客户端是否与自由线程 Python 兼容?
  • 基于大语言模型的组合优化
  • #CSS混合模式:解决渐变背景下的文字可见性问题
  • Vue2+OpenLayers给标点Feature添加信息窗体(提供Gitee源码)
  • 实战threeJS数字孪生开源 数字工厂
  • 【Python基础篇】——第3篇:从入门到精通:掌握Python数据类型与数据结构
  • 算法3(力扣83)-删除链表中的重复元素
  • HarmonyOS 鸿蒙 ArkTs(5.0.1 13)实现Scroll下拉到顶刷新/上拉触底加载,Scroll滚动到顶部
  • .NET8.0多线程编码结合异步编码示例
  • SpringBoot项目中解决CORS跨域资源共享问题
  • Android string.xml中特殊字符转义
  • 解析传统Workflow、AI Workflow与AI Agent概念,并通过Coze案例探讨利用AI工作流构建应用的实践流程
  • 光谱相机的光谱分辨率可以达到多少?
  • android Recyclerview viewholder统一封装
  • Windows部署NVM并下载多版本Node.js的方法(含删除原有Node的方法)
  • 51单片机入门基础
  • 老centos7 升级docker.io为docker-ce 脚本
  • 数仓建模(三)建模三步走:需求分析、模型设计与数据加载
  • PHP xml 常用函数整理
  • 数据结构(Java版)第八期:LinkedList与链表(三)
  • 数据结构学习记录-数据结构概念
  • 【Linux】11.Linux基础开发工具使用(4)