当前位置: 首页 > news >正文

【AIGC核心技术剖析】改进视频修复的传播和变压器(动态滤除环境中的物体)

在这里插入图片描述
在这里插入图片描述

基于流的传播和时空变压器是视频修复(VI)中的两种主流机制。尽管这些组件有效,但它们仍然受到一些影响其性能的限制。以前基于传播的方法在图像域或特征域中单独执行。与学习隔离的全局图像传播可能会由于光流不准确而导致空间错位。此外,内存或计算约束限制了特征传播和视频变压器的时间范围,阻止了对远帧对应信息的探索。为了解决这些问题,我们提出了一个改进的框架,称为ProPagation,它涉及增强的ProPagation和高效的Transformer。具体来说,我们引入了双域传播,它结合了图像和特征扭曲的优点,可靠地利用了全局对应关系。我们还提出了一种掩码引导的稀疏视频转换器,它通过丢弃不必要和冗余的令牌来实现高效率。有了这些组件,ProPainter在PSNR中以1.46 dB的较大优势优于现有技术,同时保持了吸引人的效率。

🌐page: https://shangchenzhou.com/projects/ProPainter/

📄paper: https://arxiv.org/abs/2309.03897

🧬code: https://github.com/sczhou/ProPainter

🦒colab: please try it 🐣 https://github.com/camenduru/ProPainter-colab

项目介绍:https://shangchenzhou.com/projects/ProPainter/

http://www.lryc.cn/news/199013.html

相关文章:

  • Win系统VMware虚拟机安装配置(二)
  • 基于枚举实现的观察者模式
  • 基于神经网络的图像识别研究
  • 基于SSM的工资管理系统
  • 微服务负载均衡实践
  • php定时任务
  • 2.2 如何使用FlinkSQL读取写入到文件系统(HDFS\Local\Hive)
  • call函数和apply函数的区别
  • JavaCV踩坑之路1——Mac上安装OpenCV
  • es6(三)——常用es6(函数、数组、对象的扩展)
  • API网关与社保模块
  • linux 安装 docker
  • 整数转罗马数字
  • 利用爬虫采集音频信息完整代码示例
  • WebSocket: 实时通信的新维度
  • postgresql(openGauss)模糊匹配参数
  • jdk 加密 aes jar包解决
  • C++ Primer 第十一章 关联容器 重点解读
  • MySQL 8 - 能够成功创建其他用户但无法修改 root 用户的密码
  • k8s kubernetes 1.23.6 + flannel公网环境安装
  • 博客系统中的加盐算法
  • 同花顺动态Cookie反爬JS逆向分析
  • 异步加载JS的方法
  • IO/NIO交互模拟及渐进式实现
  • springboot+html实现密码重置功能
  • LeetCode 2525. 根据规则将箱子分类【模拟】1301
  • atcoder [Road of the King] 题解(DP好题)
  • CImageList 图像列表
  • 【OpenGL】四、坐标系统和摄像机
  • 使用vcpkg管理依赖第三库