什么是Dirichlet分布?
Dirichlet分布是一种概率分布,用于描述多维随机变量的概率分布。它是一个连续分布,通常用于处理具有多种可能取值的离散型随机变量。在LDA模型中,Dirichlet分布通常被用作先验分布,用来表示主题的概率分布和单词的概率分布。
Dirichlet分布的概率密度函数如下所示:
Dirichlet ( α ) = 1 B ( α ) ∏ i = 1 k x i α i − 1 \text{Dirichlet}(\alpha) = \frac{1}{B(\alpha)}\prod_{i=1}^k x_i^{\alpha_i-1} Dirichlet(α)=B(α)1i=1∏kxiαi−1
其中, k k k 为维度, α \alpha α 为 k k k 维向量, x x x 为满足 x i ∈ [ 0 , 1 ] x_i \in [0,1] xi∈[0,1]且 ∑ i = 1 k x i = 1 \sum_{i=1}^k {x_i} = 1 ∑i=1kxi=1 的 k k k 维向量。 B ( α ) B(\alpha) B(α) 是常数项,满足以下公式:
B ( α ) = ∏ i = 1 k Γ ( α i ) Γ ( ∑ i = 1 k α i ) B(\alpha) = \frac{\prod_{i=1}^k \Gamma(\alpha_i)}{\Gamma(\sum_{i=1}^k \alpha_i)} B(α)=Γ(∑i=1kαi)∏i=1kΓ(αi)
Γ ( n ) \Gamma(n) Γ(n) 表示 gamma 函数,通常表示成 Γ ( n ) = ( n − 1 ) ! \Gamma(n)=(n-1)! Γ(n)=(n−1)!。对于参数 α \alpha α,在LDA模型中常被视为一个超参数,控制着生成模型中未知参数的分布,影响模型的结果和效果。根据 Dirichlet 分布的性质, α \alpha α 越大,对应的主题分布或单词分布越平滑,相反, α \alpha α 越小,分布的区分度也越高。