【深度学习新浪潮】如何系统性地学习扩散模型?
要系统学习扩散模型(Diffusion Models),需要从基础理论、核心模型、实践技能到前沿进展逐步推进,同时兼顾数学基础和工程实现。以下是分阶段的学习路径和关键资源:
第一阶段:基础准备(1-2周)
扩散模型本质是基于概率的生成模型,依赖统计学、机器学习和深度学习基础。先夯实以下知识:
1. 数学基础
-
概率与统计:高斯分布、条件概率、贝叶斯公式、KL散度、交叉熵(理解扩散过程中的概率转换)。
-
随机过程:马尔可夫链(扩散过程的“逐步加噪-去噪”是马尔可夫过程)、随机微分方程(SDE,分数扩散模型的核心)。
-
微积分与线性代数:梯度、偏导数(分数匹配中的梯度估计)、矩阵运算(模型参数计算)。
学习资源:
- 概率统计:MIT 6.041(