期望与方差
期望与方差
期望
期望描述了随机变量的平均情况,衡量了随机变量
$$ \mathbb{E}[X]=\sum_{i=1}^{\infty} x_{i} p_{i} $$
若右侧级数不收敛,则期望不存在。连续性随机变量
$$ \mathbb{E}[X]=\int_{-\infty}^{\infty} x p(x) d x $$
若右侧极限不收敛,则期望不存在。
期望的性质
常数的期望就是常数本身,对常数
$$ \mathbb{E}[C X]=C \mathbb{E}[X] $$
对两个随机变量
$$ \mathbb{E}[X+Y]=\mathbb{E}[X]+\mathbb{E}[Y] $$
该结论可以推广到任意有限个随机变量之和的情况。对两个相互独立的随机变量,有:
$$ \mathbb{E}[X Y]=\mathbb{E}[X] \mathbb{E}[Y] $$
该结论可以推广到任意有限个相互独立的随机变量之积的情况。这里以离散型随机变量为例,设二元随机变量
$$ \begin{aligned} E(X Y) &=\sum_{i=1}^{m} \sum_{j=1}^{n} x_{i} y_{j} P\left(X=x_{i}, Y=y_{j}\right)=\sum_{i=1}^{m} \sum_{j=1}^{n} x_{i} y_{j} P\left(X=x_{i}\right) P\left(Y=y_{j}\right) \ &=\sum_{i=1}^{m} x_{i} P\left(X=x_{i}\right) \sum_{j=1}^{n} y_{j} P\left(Y=y_{j}\right)=E(X) E(Y) \end{aligned} $$
复合函数期望
对于随机变量
若
$$ \mathbb{E}[Y]=\mathbb{E}[g(X)]=\sum_{i=1}^{\infty} g\left(x_{i}\right) p_{i} $$
也记作:
$$ \mathbb{E}{X \sim P(X)}[g(X)]=\sum{x} g(x) p(x) $$
同样,若
$$ \mathbb{E}[Y]=\mathbb{E}[g(X)]=\int_{-\infty}^{\infty} g(x) p(x) d x $$
也记作:
$$ \mathbb{E}_{X \sim P(X)}[g(X)]=\int g(x) p(x) d x $$
该定理的意义在于:当求
$$ \mathbb{E}[Z]=\mathbb{E}[g(X, Y)]=\int_{-\infty}^{\infty} \int_{-\infty}^{\infty} g(x, y) p(x, y) d x d y $$
也记作:
$$ \mathbb{E}_{X, Y \sim P(X, Y)}\left[g(X, Y) \int g(x, y) p(x, y) d x d y\right. $$
方差
对随机变量
$$ \begin{aligned} \operatorname{Var}[X] &=\mathbb{E}\left[(X-\mathbb{E}[X])^{2}\right] \ \sigma &=\sqrt{\operatorname{Var}[X]} \end{aligned} $$
方差度量了随机变量
根据定义可知:
$$ \begin{array}{c}{\operatorname{Var}[X]=\mathbb{E}\left[(X-\mathbb{E}[X])^{2}\right]=\mathbb{E}\left[X^{2}\right]-(\mathbb{E}[X])^{2}} \ {\operatorname{Var}[f(X)]=\mathbb{E}\left[(f(X)-\mathbb{E}[f(X)])^{2}\right]}\end{array} $$
方差的性质
常数的方差恒为
$$ \operatorname{Var}[X+Y]=\operatorname{Var}[X]+\operatorname{Var}[Y]+2 \mathbb{E}[(X-\mathbb{E}[X])(Y-\mathbb{E}[Y])] $$
当
$$ \operatorname{Var}[X+Y]=\operatorname{Var}[X]+\operatorname{Var}[Y] $$
证明如下:
$$ \begin{aligned} \operatorname{Var}(X+Y) &=E\left[(X+Y)^{2}\right]-E(X+Y)^{2} \ &=E\left(X^{2}+2 X Y+Y^{2}\right)-\left[E(X)^{2}+2 E(X) E(Y)+E(Y)^{2}\right] \ &=E\left(X^{2}\right)-E(X)^{2}+E\left(Y^{2}\right)-E(Y)^{2}+2 E(X Y)-2 E(X) E(Y) \ &=E\left(X^{2}\right)-E(X)^{2}+E\left(Y^{2}\right)-E(Y)^{2}=\operatorname{Var}(X)+\operatorname{Var}(Y) \end{aligned} $$
这可以推广至任意有限多个相互独立的随机变量之和的情况。若
$$ \operatorname{Var}\left(X_{1}+X_{2}+\cdots+X_{m}\right)=\sum_{k=1}^{n} \operatorname{Var}\left(X_{k}\right) $$
标准化变量
对于一个期望为
协方差
对于二维随机变量
$$ \operatorname{Cov}[X, Y]=\mathbb{E}[(X-\mathbb{E}[X])(Y-\mathbb{E}[Y])] $$
在有协方差定义的情况下,我们可以将前文方差的定义修改为:
$$ \begin{array}{c}{\operatorname{Cov}[X, Y]=\operatorname{Cov}[Y, X]} \ {\operatorname{Cov}[X, X]=\operatorname{Var}[X]} \ {\operatorname{Var}[X+Y]=\operatorname{Var}[X]+\operatorname{Var}[Y]+2 \operatorname{Cov}[X, Y]}\end{array} $$
协方差的性质
$$ \begin{array}{l}{\circ \operatorname{Cov}[a X, b Y]=a b \operatorname{Cov}[X, Y]} \ {\circ \operatorname{Cov}\left[X_{1}+X_{2}, Y\right]=\operatorname{Cov}\left[X_{1}, Y\right]+\operatorname{Cov}\left[X_{2}, Y\right]} \ {\circ \operatorname{Cov}[f(X), g(Y)]=\mathbb{E}[(f(X)-\mathbb{E}[f(X)])(g(Y)-\mathbb{E}[g(Y)])]} \ {\circ \rho[f(X), g(Y)]=\frac{\operatorname{Covlf}(X), g(Y) ]}{\sqrt{\operatorname{Var}[f(X)] \sqrt{\operatorname{Var}[g(Y)]}}}}\end{array} $$
协方差的绝对值越大,说明两个随机变量都远离它们的均值。协方差如果为正,则说明两个随机变量同时趋向于取较大的值或者同时趋向于取较小的值;如果为负,则说明一个随变量趋向于取较大的值,另一个随机变量趋向于取较小的值。
两个随机变量的独立性可以导出协方差为零。但是两个随机变量的协方差为零无法导出独立性。因为独立性也包括:没有非线性关系。有可能两个随机变量是非独立的,但是协方差为零。如:假设随机变量
$$ P(S=1)=\frac{1}{2} P(S=-1)=\frac{1}{2} $$
定义随机变量
相关系数
随机变量
$$ \rho_{X Y}=\frac{\operatorname{Cov}[X, Y]}{\sqrt{\operatorname{Var}[X]} \sqrt{\operatorname{Var}[Y]}} $$
它可以看做协方差的归一化。其物理意义在于,如果考虑以随机变量
$$ e=\mathbb{E}\left[(Y-(a+b X))^{2}\right]=\mathbb{E}\left[Y^{2}\right]+b^{2} \mathbb{E}\left[X^{2}\right]+a^{2}-2 b \mathbb{E}[X Y]+2 a b \mathbb{E}[X]-2 a \mathbb{E}[Y] $$
来衡量以
$$ \begin{array}{c}{a_{0}=\mathbb{E}[Y]-b_{0} \mathbb{E}[X]=\mathbb{E}[Y]-\mathbb{E}[X] \frac{\operatorname{Cov}[X, Y]}{\operatorname{Var}[X]}} \ {b_{0}=\frac{\operatorname{Cov}[X, Y]}{\operatorname{Var}[X]}} \ {\min (e)=\mathbb{E}\left[\left(Y-\left(a_{0}+b_{0} X\right)\right)^{2}\right]=\left(1-\rho_{X Y}^{2}\right) \operatorname{Var}[Y]}\end{array} $$
因此可以得到如下定理:
- $\left|\rho_{X Y}\right| \leq 1$
$\left|\rho_{X Y}\right|=1$ 的充要条件是:存在常数$a,b$ 使得$P{Y=a+b X}=1$ 。
当
当
协方差矩阵
假设
-
假如
$\mathbb{E}\left[X^{k}\right], k=1,2, \cdots$ 存在,则称它为$X$ 的$k$ 阶原点矩,简称$k$ 阶矩。 -
假如
$\mathbb{E}\left[(X-\mathbb{E} )^{k}\right], k=2,3, \cdots$ 存在,则称它为$X$ 的$k$ 阶中心矩。 -
假如
$\mathbb{E}\left[X^{k} Y^{l}\right], k, l=1,2, \cdots$ 存在,则称它为$X$ 和$Y$ 的$k+l$ 阶混合矩。 -
假如
$\mathbb{E}\left[(X-\mathbb{E} )^{k}(Y-\mathbb{E}[Y])^{l}\right], k, l=1,2, \cdots$ 存在,则称它为$X$ 和$Y$ 的$k+l$ 阶混合中心矩。
因此期望是一阶原点矩,方差是二阶中心矩,协方差是二阶混合中心矩。而协方差矩阵,就定义为二维随机变量
$$ \begin{array}{c}{c_{11}=\mathbb{E}\left[\left(X_{1}-\mathbb{E}\left[X_{1}\right]\right)^{2}\right]} \ {c_{12}=\mathbb{E}\left[\left(X_{1}-\mathbb{E}\left[X_{1}\right]\right)\left(X_{2}-\mathbb{E}\left[X_{2}\right]\right)\right]} \ {c_{21}=\mathbb{E}\left[\left(X_{2}-\mathbb{E}\left[X_{2}\right]\right)\left(X_{1}-\mathbb{E}\left[X_{1}\right]\right)\right]} \ {c_{22}=\mathbb{E}\left[\left(X_{2}-\mathbb{E}\left[X_{2}\right]\right)^{2}\right]}\end{array} $$
称矩阵:
$$ \mathbf{C}=\left[\begin{array}{ll}{c_{11}} & {c_{12}} \ {c_{21}} & {c_{22}}\end{array}\right] $$
为随机变量
$$ \mathbf{C}=\left[\begin{array}{cccc}{c_{11}} & {c_{12}} & {\cdots} & {c_{1 n}} \ {c_{21}} & {c_{22}} & {\cdots} & {c_{2 n}} \ {\vdots} & {\vdots} & {\ddots} & {\vdots} \ {c_{n 1}} & {c_{n 2}} & {\cdots} & {c_{n n}}\end{array}\right] $$
为