当前位置: 首页 > news >正文

Deep Mean-Shift Priors for Image Restoration论文阅读

Deep Mean-Shift Priors for Image Restoration

      • 1. 论文的研究目标与实际意义
      • 2. 创新方法:深度均值漂移先验(Deep Mean-Shift Prior)
        • 2.1 核心思想与理论基础
          • 2.1.1 高斯平滑自然图像分布(Gaussian-Smoothed Natural Image Distribution)
          • 2.1.2 均值漂移向量(Mean-Shift Vector)与DAE的等价性
        • 2.2 贝叶斯风险最小化框架
          • 2.2.1 目标函数构建
          • 2.2.2 噪声盲处理的自适应机制
        • 2.3 随机梯度下降优化
          • 2.3.1 解决DAE过拟合问题
          • 2.3.2 动量加速梯度下降
        • 2.4 与传统方法的对比优势
        • 2.5 创新总结
      • 3. 实验设计与结果
        • 3.1 实验设置
        • 3.2 关键结果
      • 4. 未来研究方向
      • 5. 不足与挑战
      • 6. 实用创新点与学习建议

1. 论文的研究目标与实际意义

研究目标
论文旨在解决图像恢复中的噪声盲(noise-blind)完全盲(fully blind)问题(如去模糊、超分辨率、去马赛克),即在不预先知晓噪声水平或模糊核的情况下恢复高质量图像。核心创新是提出一种基于高斯平滑自然图像分布的通用先验——深度均值漂移先验(Deep Mean-Shift Prior),并将其嵌入贝叶斯估计框架中。

实际意义

  1. 产业应用
    • 手机摄影:解决低光环境下噪声未知的图像去模糊问题。
    • 医学影像:提升噪声未知的MRI/CT图像重建质量。
    • 监控系统:增强低分辨率或运动模糊的监控画面。
  2. 技术痛点:传统方法需预先估计噪声或模糊核,而实际场景中这些参数未知,导致误差累积。本文方法无需预知参数,提升了鲁棒性。

2. 创新方法:深度均值漂移先验(Deep Mean-Shift Prior)

2.1 核心思想与理论基础
2.1.1 高斯平滑自然图像分布(Gaussian-Smoothed Natural Image Distribution)

论文提出一种直接建模自然图像概率分布的先验,通过高斯核平滑其分布:
p ′ ( x ) = ∫ g σ ( η ) p ( x + η ) d η (Eq.4) p'(x) = \int g_{\sigma}(\eta) p(x+\eta) d\eta \quad \text{(Eq.4)} p(x)=gσ(η)p(x+η)dη(Eq.4)
其中 g σ ( η ) g_{\sigma}(\eta) gσ(η) 是标准差为 σ \sigma σ 的高斯核, p ( x ) p(x) p(x) 是真实的自然图像分布。该平滑分布可视为核密度估计(Kernel Density Estimate),避免因有限样本导致的建模偏差。

2.1.2 均值漂移向量(Mean-Shift Vector)与DAE的等价性

均值漂移(Mean-Shift):一种非参数密度估计技术,通过迭代计算数据点梯度的均值来定位概率密度函数的极值点。
去噪自编码器(Denoising Autoencoder, DAE):通过最小化带噪输入与干净目标的差异,学习噪声分布的统计特性。

论文核心发现:去噪自编码器的残差等价于平滑分布对数梯度的缩放,即均值漂移向量:
∇ log ⁡ p ′ ( x ) = 1 σ 2 ( r σ ( x ) − x ) (Eq.14) \nabla \log p'(x) = \frac{1}{\sigma^{2}} \left( r_{\sigma}(x) - x \right) \quad \text{(Eq.14)} logp(x)=σ21(rσ(x)x)(Eq.14)
此处 r σ ( x ) r_{\sigma}(x) rσ(x) 是DAE对含噪输入 x + η x + \eta x+η η ∼ N ( 0 , σ 2 ) \eta \sim \mathcal{N}(0, \sigma^2) ηN(0,σ2))的重建输出。该公式表明:

“The DAE error is proportional to the gradient of the log prior.”
—— 即DAE的残差 ( r σ ( x ) − x ) (r_{\sigma}(x) - x) (rσ(x)x) 直接编码了自然图像分布的结构信息。

2.2 贝叶斯风险最小化框架
2.2.1 目标函数构建

基于贝叶斯估计器,定义效用函数(Utility Function):
G ( x ~ , x ) = g σ ( x ~ − x ) p ′ ( x ) p ( x ~ ) (Eq.5) G(\tilde{x},x) = g_{\sigma}(\tilde{x}-x) \frac{p'(x)}{p(\tilde{x})} \quad \text{(Eq.5)} G(x~,x)=gσ(x~x)p(x~)p(x)(Eq.5)
通过最大化后验期望效用(Eq.3),推导出下界目标函数:
Φ ( x ) = ∫ g σ ( ϵ ) log ⁡ p ( y ∣ x + ϵ ) d ϵ ⏟ Data term + log ⁡ ∫ g σ ( η ) p ( x + η ) d η ⏟ Prior term (Eq.7) \Phi(x) = \underbrace{\int g_{\sigma}(\epsilon) \log p(y \mid x+\epsilon) d\epsilon}_{\text{Data term}} + \underbrace{\log \int g_{\sigma}(\eta) p(x+\eta) d\eta}_{\text{Prior term}} \quad \text{(Eq.7)} Φ(x)=Data term

http://www.lryc.cn/news/577311.html

相关文章:

  • 一些LINQ的普遍写法
  • 文心4.5开源大模型的使用和部署
  • K8S初始化master节点不成功kubelet.service failed(cgroup driver配置问题)
  • Python 数据分析与机器学习入门 (六):Seaborn 可视化技巧,图表更美观
  • Python 库 包 accelerate
  • 插入排序的简单介绍
  • 百度文心大模型4.5系列正式开源,同步开放API服务
  • 百度文心大模型4.5系列正式开源,开源会给百度带来什么?
  • MongoDB 安装使用教程
  • 御控助力打造物联网实训室,赋能职业教育高质量发展
  • I/O I/O基本概念与基本I/O函数 6.30
  • YOLOv12_ultralytics-8.3.145_2025_5_27部分代码阅读笔记-autobackend.py
  • LeetCode Hot100(图论)
  • huggingface----深度学习 Diffusers 库
  • TCPView v4.19 网络检测和拦截工具——东方仙盟
  • 类图+案例+代码详解:软件设计模式----生成器模式(建造者模式)
  • 炸鸡派-基础测试例程
  • STM32 驱动 ADS1015 单端 差分 多通道模式 ADC 转换
  • 海康相机总是抓取前一帧图像
  • jenkins集成sonarqube(使用token进行远程调用)
  • ShardingSphere完成MySQL集群部署
  • RK3588高性能处理器核心技术解析
  • MLOps 基础:驯服模型生命周期的科学
  • GitHub Actions 入门指南:从零开始自动化你的开发流程
  • 手机屏暗点缺陷修复及相关液晶线路激光修复原理
  • 超大js文件多层级引用缓存在网络较差的时候无法调用使用问题
  • BERT 模型详解:结构、原理解析
  • RWKV-8 系列之 DeepEmbedAttention:精简 KV 缓存,尤其适合混合模型(RWKV-7s)
  • MySQL 慢查询日志详解
  • 小白excel中使用VBA