概率与分布
概率与分布
概率分布(Probability Distribution)用来描述随机变量或一簇随机变量在每一个可能取到的状态的可能性大小。我们描述概率分布的方式取决于随机变量是离散的还是连续的。
离散型变量和概率质量函数
离散型变量的概率分布可以用概率质量函数(Probability mass function, PMF)来描述。我们通常用大写字母
概率质量函数将随机变量能够取得的每个状态映射到随机变量取得该状态的概率。
概率质量函数可以同时作用于多个随机变量,这种多个变量的概率分布被称为联合概率分布(joint probability distribution
如果一个函数
-
$P$ 的定义域必须是$\mathrm{x}$ 所有可能状态的集合。 -
$\forall x \in \mathrm{x}, 0 \leq P(x) \leq 1$ 不可能发生的事件概率为0 ,并且不存在比这概率更低的状态。类似的,能够确保一定发生的事件概率为1 ,而且不存在比这概率更高的状态。 -
$\sum_{x \in \mathrm{x}} P(x)=1$ 我们把这条性质称之为归一化的(normalized) 。如果没有这条性质,当我们计算很多事件其中之一发生的概率时可能会得到大于1 的概率。
例如,考虑一个离散型随机变量
$$ P\left(\mathrm{x}=x_{i}\right)=\frac{1}{k} $$
对于所有的
$$ \sum_{i} P\left(\mathrm{x}=x_{i}\right)=\sum_{i} \frac{1}{k}=\frac{k}{k}=1 $$
因此分布也满足归一化条件。
连续型变量和概率密度函数
当我们研究的对象是连续型随机变量时,我们用概率密度函数(Probability density function, PDF)而不是概率质量函数来描述它的概率分布。如果一个函数
-
$p$ 的定义域必须是$\mathrm{x}$ 所有可能状态的集合。 -
$\forall x \in \mathrm{x}, p(x) \geq 0$,值得一提的是,并不要求:$p(x) \leq 1$。
-
$\int p(x) d x=1$
概率密度函数
为了给出一个连续型随机变量的
- 为了确保区间外没有概率,我们对所有的
$x \notin[a, b]$ ,令$u(x ; a, b)=0$ 。 - 在
$[a,b]$ 内,有$u(x ; a, b)=\frac{1}{b-a}$ 。
上述函数中,任何一点都非负,并且其积分为
条件概率与独立事件
所谓条件概率,已知
条件概率分布满足链式法则,对于
$$ P\left(X_{1}, X_{2}, \cdots, X_{n}\right)=P\left(X_{1}\right) \prod_{i=2}^{n} P\left(X_{i} | X_{1}, \cdots, X_{i-1}\right) $$
独立
两个随机变量
$$ P(X, Y)=P(X) P(Y) $$
两个随机变量
$$ P(X, Y | Z)=P(X | Z) P(Y | Z) $$
联合概率分布
定义
$$ P(a, b)=P{X \leq a, Y \leq b}, \quad-\infty<a, b<+\infty $$
$$ P_{X}(a)=P{X \leq a}=P{X \leq a, Y \leq \infty}=P(a, \infty), \quad-\infty<a<+\infty $$
$$ P_{Y}(b)=P{Y \leq b}=P{X \leq \infty, Y \leq b}=P(\infty, b), \quad-\infty<b<+\infty $$