多项分布
Bernoulli Distribution | 伯努利分布
伯努利分布是关于布尔变量
$$ P(x|\phi)=Bern(x|\phi)=\phi^x(1-x)^{(1-x)} \ E[x] = \phi \ Var[x] = \phi(1-\phi) $$
Binomial Distribution | 二项分布
二项分布用以描述
$$ p(X=x)=\frac{n !}{x !(n-x) !} \phi^{x}(1-\phi)^{n-x}, x \in{0,1, \cdots, n} $$
当
二项分布的期望
Categorical/Multinomial Distribution | 多项分布
比如扔骰子,不同于扔硬币,骰子有
$$ P = C(n,x)p^x(1-p)^{n-x} $$
严格定义来说,将伯努利分布由单变量扩展到
$$ P(x|\mu) = \prod_{i=1}^d \mu_i^{x_i} \ E[x_i] = \mu_i \ Var[x_i] = \mu_i(1 - \mu_i) \ Cov[x_j,x_i] = \prod[j=i] \mu_i $$
在此基础上扩展二项分布则得到多项分布,它描述了在
$$ P(m_1,m_2,…,m_d|N,\mu)=Mult(m_1,m_2,…,m_d | N,\mu) \ = \frac{N!}{m_1!m_2!…m_d!}\prod_{i=1}^d \mu_i^{m_i} \ E[m_i] = N_{\mu_i} \ Var[m_i] = N_{\mu_i}(1-\mu_i) \ Cov[m_j,m_i] = -N_{\mu_j \mu_i} $$
狄里克雷分布
多项式分布的质量密度函数:
$$ \operatorname{Mult}\left(m_{1}, m_{2}, \cdots, m_{K} ; \vec{\mu}, N\right)=\frac{N !}{m_{1} ! m_{2} ! \cdots m_{K} !} \prod_{k=1}^{K} \mu_{k}^{m_{k}} $$
它是
狄利克雷分布的概率密度函数:
$$ \operatorname{Dir}(\vec{\mu} ; \vec{\alpha})=\frac{\Gamma\left(\sum_{k=1}^{K} \alpha_{k}\right)}{\sum_{k=1}^{K} \Gamma\left(\alpha_{k}\right)} \prod_{k=1}^{K} \mu_{k}^{\alpha_{k}-1} $$
可以看到,多项式分布与狄里克雷分布的概率密度函数非常相似,区别仅仅在于前面的归一化项:
- 多项式分布是针对离散型随机变量,通过求和获取概率。
- 狄里克雷分布时针对连续型随机变量,通过求积分来获取概率。