当前位置: 首页 > news >正文

Masked Relation Learning for DeepFake Detection

一、研究背景
1.现有deepfake检测方法大多关注于局部伪影或面部不协调,较少挖掘局部区域间的关系。
2.现有关系挖掘类的工作往往忽略了关系信息的传播。
3.遮挡建模在减轻信息冗余的同时促进高级语义信息(诱导性偏差较小)的挖掘,有助于提升网络的泛化性能。

二、研究动机
1.Deepfake技术会单独操纵视频中的每一帧,伪造结果缺乏时间连贯性。基于视频的检测技术更加关注相邻帧之间的时间不连贯性和时空不一致性,可降低对空间伪影的依赖并提升泛化性能。
2.将关系特征作为一种泛化模式可以提升检测性能,但大量的冗余关系信息会阻碍信息的表达。遮挡建模能减少信息的冗余,迫使模型习得更具泛化性的内在特征。

三、研究目标
从区域级关系中学习通用的鉴别性特征,减轻对视觉伪影的依赖。

四、技术路线

  • 本文将deepfake检测任务定义为图分类问题,每个面部区域作为一个图的结点,并对结点间的关系进行建模。
  • 对部分关系进行屏蔽,减少冗余并促进模型对全局结构的感知
  • 实现在无监督的情况下定位面部伪造区域。
    在这里插入图片描述

1.时空注意力模块(STA):
学习不同面部区域的注意力特征。

  • 将特征图 F 0 t F_{0}^t F0t转换为注意力图 F A t F_{A}^t FAt
  • 用注意力图强调特征图得到注意力特征图 F t F^t Ft
  • 对注意力特征图进行平均归一化得到注意力特征向量 V t V^t Vt
    在这里插入图片描述
  • 设置正交多样性损失 L o d L_{od} Lod使不同注意力特征向量关注不同面部信息
  • T为视频片段划分数量, V t ∈ R N ∗ C V^t\in \mathbb{R}^{N*C} VtRNC N N N为注意力头数量, I I I为单位阵
  • (4)使不同注意力头的输出差异尽可能大
    在这里插入图片描述
  • 设置时间一致性损失 L t c L_{tc} Ltc,使每个注意力头在时间维度上追踪各自区域
  • (5)使相邻帧之间的注意力向量保持一致
    在这里插入图片描述

2.遮挡关系学习模块(MRL):
屏蔽部分区域间的相关性以减少信息冗余,以此促进对本质特征的学习并捕获全局视角下的不规则关系。

  • 最小屏蔽策略:计算门限值 q q q p p p为预定义参数
    在这里插入图片描述

  • 随机屏蔽策略:根据伯努利分布采样 η \eta η
    在这里插入图片描述

  • 利用TGCN捕获不规则关系:TGCN由GCN和GRU构成

  • 在这里插入图片描述

  • 对特征关系图进行图卷积计算
    在这里插入图片描述

  • 对隐藏层进行图卷积计算
    在这里插入图片描述

  • 更新隐藏层
    在这里插入图片描述
    3.特征分类
    在这里插入图片描述
    4.损失函数
    在这里插入图片描述
    5.算法流程
    在这里插入图片描述
    在这里插入图片描述
    五、实验结果
    Although our method has sub-optimal performance on FF++(HQ), it outperforms state-of-the-art approaches on detecting
    unseen deepfake datasets. Strong generalization ability is one of the pursuits of deepfake detection. Our method effectively promotes the generalization ability of detectors.
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    Hereby we localize the fake regions by Grad-CAM in Fig. 9. We observe that our method can highlight the fake regions of
    manipulated faces. For instance, NeuralTextures only modifies the mouth region
    在这里插入图片描述

http://www.lryc.cn/news/230559.html

相关文章:

  • R语言爬虫程序自动爬取图片并下载
  • 2023年10月国产数据库大事记-墨天轮
  • Linux内核分析(十四)--内存管理之malloc、free 实现原理
  • Hive函数
  • 教资笔记(目录)
  • np.repeat()的注意事项
  • 239. 滑动窗口最大值
  • c++ barrier 使用详解
  • c# 接口
  • 1、NPC 三电平SVPWM simulink仿真
  • JAVA对象列表强转失败,更好的方法
  • 2023最新版本 从零基础入门C++与QT(学习笔记) -5- 动态内存分配(new)
  • asp.net校园招聘管理系统VS开发sqlserver数据库web结构c#编程Microsoft Visual Studio
  • flink的键值分区状态自动过期ttl配置
  • 解决Mac配置maven环境后,关闭终端后环境失效的问题(适用于所有终端关闭后环境失效的问题)
  • springboot运行jar包,实现复制jar包resources下文件、文件夹(可支持包含子文件夹)到指定的目录
  • Webpack Bundle Analyzer包分析器
  • SQL-----STUDENT
  • OpenCV入门——图像视频的加载与展示一些API
  • Control的Invoke和BeginInvoke
  • 什么是OpenCL?
  • AdaBoost:提升机器学习的力量
  • Pikachu(皮卡丘靶场)初识XSS(常见标签事件及payload总结)
  • 一则DNS被重定向导致无法获取MySQL连接处理
  • Vue3中如何使用this
  • 7.jvm对象内存布局
  • U-boot(一):Uboot命令和tftp
  • 代码随想录算法训练营第五十三天丨 动态规划part14
  • pdf增强插件 Enfocus PitStop Pro 2022 mac中文版功能介绍
  • uniapp app tabbar 页面默认隐藏