期望:
1. 定义:
设离散型随机变量$X$的分布律为:$P{X=x_i}=p_k, k=1,2,...$,若级数$\displaystyle\sum_{k=1}^{\infty} x_k p_k$绝对收敛,则称该级数的和为随机变量$X$的数学期望(mean),记为$E(X)$。即
$$ E(X)=\displaystyle\sum_{k=1}^{\infty} x_k p_k $$
设连续型随机变量$X$的概率密度为$f(x)$,若积分$\textstyle{\Large\int}_{-\infty}^{\infty}xf(x)dx$绝对收敛,则称该积分的值为随机变量$X$的数学期望,记为$E(x)$,即
$$ E(x)=\textstyle{\Large\int}_{-\infty}^{\infty}xf(x)dx $$
数学期望简称为期望,又称为均值。
数学期望$E(x)$完全由随机变量$X$的概率密度所确定,若$X$服从某一分布,也称$E(X)$是这一分布的数学期望。
2. 期望的性质
- 设$C$是常数,则有$E(C)=C$
- 设$X$是一个随机变量,$C$是常数,则有$E(CX)=CE(X)$
- 设$X$,$Y$是两个随机变量,则有$E(X+Y)=E(x)+E(Y)$
- 设$X$,$Y$是相互独立的随机变量,则有$E(XY)=E(X)E(Y)$
方差
1. 定义
设$X$是一个随机变量,若$E{[X-E(X)]^2}$存在,则称其为$X$的方差(variance)记为$D(X)$或$Var(X)$,即:
$$ D(X)=Var(X)=E{[X-E(X)]^2} $$
在应用上还引入量$\sqrt{D(X)}$,记为$\sigma(X)$,称为标准差或均方差。
随机变量$X$的方差表达了$X$的取值与其数学期望的偏离程度,若$D(X)$较小意味着$X$的取值比较集中在$E(X)$附近;反之若$D(X)$较大则意味着$X$的取值比较分散。因此$D(X)$是刻画$X$取值分散度的一个量,它是衡量$X$取值分散程度的一个尺度。
对于离散型随机变量,
$$ D(X)=\displaystyle\sum_{k=1}^{\infty}[x_k-E(X)]^2 p_k $$
其中$P{X=x_i}=p_k, k=1,2,...$是$X$的分布律
对于连续型的随机变量,
$$ D(X)=\textstyle{\Large\int}_{-\infty}^{\infty}[x-E(X)]^2f(x)dx $$
其中$f(x)$是$X$的概率密度。
随机变量$X$的方差也可以按照下列公式计算:
$$ D(X)=E(X^2)-[E(X)]^2 $$
2. 方差的性质
- 设$C$是常量,则$D(C)=0$
- 设$X$是随机变量,$C$是常数,则$D(CX)=C^2D(X)$,$D(X+C)=D(X)$
- 设$X$,$Y$是随机变量,则有
$$ D(X+Y)=D(X)+D(Y)+2E{[X-E(X)][Y-E(Y)]} $$
特别地,如果$X$,$Y$相互独立,则有
$$ D(X+Y)=D(X)+D(Y) $$
协方差
1. 定义
量$E{[X-E(X)][Y-E(Y)]$称为随机变量$X$和$Y$的协方差(Covariance)。记为$Cov(X,Y)$,即
$$ Cov(X,Y)=E{[X-E(X)][Y-E(Y)] $$
而
$$ \rho_{XY}=\dfrac{Cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}} $$
称为随机变量$X$与$Y$的相关系数。
由定义可知:$Cov(X,Y)=Cov(Y,X)$,$Cov(X,X)=D(X)$
方差也可以表达成
$$ D(X+Y)=D(X)+D(Y)+2Cov(X,Y) $$
2. 协方差的性质
- $Cov(aX,bY)=abCov(X,Y)$,$a,b$是常数
- $Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y)$
3. 相关系数的性质
- $|\rho_{XY}|\leqslant 1$
- $|\rho_{XY}|= 1$的充要条件是存在常数$a,b$使得$P{Y=a+bX}=1$,即当$|\rho_{XY}|= 1$时,$X$,$Y$之间以概率1存在着线性关系。
- $|\rho_{XY}|=0$时,称$X$和$Y$不线性相关。
$\rho_{XY}$是一个可以用来表征$X$,$Y$之间线性关系紧密程度的量,当$|\rho_{XY}|$较大时,二者的线性相关程度较好,当$|\rho_{XY}|$较小时,二者的线性相关程度较差。
4. “不相关”和“相互独立”
$X$和$Y$不线性相关,并不表示$X$和$Y$相互独立,二者直接可能存在非线性关系,比如平方的关系。相关是就线性关系来说的。
特殊地,对于服从正态分布的随机变量,$X$和$Y$不相关和相互独立是等价的。
协方差矩阵
定义
$n$维随机变量$(X_1,X_2,...,X_n)$,任意二维随机变量的协方差
$$ c_{ij}=Cov(X_i,X_j)=E{[X_i-E(X_i)][X_j-E(X_j)] $$
其中$i,j=1,2,...,n$,都存在,则称矩阵:
$$ C=\begin{bmatrix} c_{11} & c_{12} & ... & c_{1n} \ c_{21} & c_{22} & ... & c_{2n} \ \vdots & \vdots & & \vdots \ c_{n1} & c_{n2} & ... & c_{nn} \end{bmatrix} $$
为$n$维随机变量的协方差矩阵。由于$c_{ij}=c_{ji}$,因此协方差矩阵是一个对称矩阵。