期望:

1. 定义:

离散型随机变量$X$的分布律为:$P{X=x_i}=p_k, k=1,2,...$,若级数$\displaystyle\sum_{k=1}^{\infty} x_k p_k$绝对收敛,则称该级数的和为随机变量$X$的数学期望(mean,记为$E(X)$。即

$$ E(X)=\displaystyle\sum_{k=1}^{\infty} x_k p_k $$

连续型随机变量$X$的概率密度为$f(x)$,若积分$\textstyle{\Large\int}_{-\infty}^{\infty}xf(x)dx$绝对收敛,则称该积分的值为随机变量$X$的数学期望,记为$E(x)$,即

$$ E(x)=\textstyle{\Large\int}_{-\infty}^{\infty}xf(x)dx $$

数学期望简称为期望,又称为均值。

数学期望$E(x)$完全由随机变量$X$的概率密度所确定,若$X$服从某一分布,也称$E(X)$是这一分布的数学期望。

2. 期望的性质

  • 设$C$是常数,则有$E(C)=C$
  • 设$X$是一个随机变量,$C$是常数,则有$E(CX)=CE(X)$
  • 设$X$,$Y$是两个随机变量,则有$E(X+Y)=E(x)+E(Y)$
  • 设$X$,$Y$是相互独立的随机变量,则有$E(XY)=E(X)E(Y)$

方差

1. 定义

设$X$是一个随机变量,若$E{[X-E(X)]^2}$存在,则称其为$X$的方差(variance记为$D(X)$或$Var(X)$,即:

$$ D(X)=Var(X)=E{[X-E(X)]^2} $$

在应用上还引入量$\sqrt{D(X)}$,记为$\sigma(X)$,称为标准差均方差

随机变量$X$的方差表达了$X$的取值与其数学期望的偏离程度,若$D(X)$较小意味着$X$的取值比较集中在$E(X)$附近;反之若$D(X)$较大则意味着$X$的取值比较分散。因此$D(X)$是刻画$X$取值分散度的一个量,它是衡量$X$取值分散程度的一个尺度。

对于离散型随机变量,

$$ D(X)=\displaystyle\sum_{k=1}^{\infty}[x_k-E(X)]^2 p_k $$

其中$P{X=x_i}=p_k, k=1,2,...$是$X$的分布律

对于连续型的随机变量,

$$ D(X)=\textstyle{\Large\int}_{-\infty}^{\infty}[x-E(X)]^2f(x)dx $$

其中$f(x)$是$X$的概率密度。

随机变量$X$的方差也可以按照下列公式计算:

$$ D(X)=E(X^2)-[E(X)]^2 $$

2. 方差的性质

  • 设$C$是常量,则$D(C)=0$
  • 设$X$是随机变量,$C$是常数,则$D(CX)=C^2D(X)$,$D(X+C)=D(X)$
  • 设$X$,$Y$是随机变量,则有

$$ D(X+Y)=D(X)+D(Y)+2E{[X-E(X)][Y-E(Y)]} $$

特别地,如果$X$,$Y$相互独立,则有

$$ D(X+Y)=D(X)+D(Y) $$

协方差

1. 定义

量$E{[X-E(X)][Y-E(Y)]$称为随机变量$X$和$Y$的协方差(Covariance。记为$Cov(X,Y)$,即

$$ Cov(X,Y)=E{[X-E(X)][Y-E(Y)] $$

$$ \rho_{XY}=\dfrac{Cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}} $$

称为随机变量$X$与$Y$的相关系数

由定义可知:$Cov(X,Y)=Cov(Y,X)$,$Cov(X,X)=D(X)$

方差也可以表达成

$$ D(X+Y)=D(X)+D(Y)+2Cov(X,Y) $$

2. 协方差的性质

  • $Cov(aX,bY)=abCov(X,Y)$,$a,b$是常数
  • $Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y)$

3. 相关系数的性质

  • $|\rho_{XY}|\leqslant 1$
  • $|\rho_{XY}|= 1$的充要条件是存在常数$a,b$使得$P{Y=a+bX}=1$,即当$|\rho_{XY}|= 1$时,$X$,$Y$之间以概率1存在着线性关系
  • $|\rho_{XY}|=0$时,称$X$和$Y$不线性相关。

$\rho_{XY}$是一个可以用来表征$X$,$Y$之间线性关系紧密程度的量,当$|\rho_{XY}|$较大时,二者的线性相关程度较好,当$|\rho_{XY}|$较小时,二者的线性相关程度较差。

4. “不相关”和“相互独立”

$X$和$Y$不线性相关,并不表示$X$和$Y$相互独立,二者直接可能存在非线性关系,比如平方的关系。相关是就线性关系来说的。

特殊地,对于服从正态分布的随机变量,$X$和$Y$不相关和相互独立是等价的。

协方差矩阵

定义

$n$维随机变量$(X_1,X_2,...,X_n)$,任意二维随机变量的协方差

$$ c_{ij}=Cov(X_i,X_j)=E{[X_i-E(X_i)][X_j-E(X_j)] $$

其中$i,j=1,2,...,n$,都存在,则称矩阵:

$$ C=\begin{bmatrix} c_{11} & c_{12} & ... & c_{1n} \ c_{21} & c_{22} & ... & c_{2n} \ \vdots & \vdots & & \vdots \ c_{n1} & c_{n2} & ... & c_{nn} \end{bmatrix} $$

为$n$维随机变量的协方差矩阵。由于$c_{ij}=c_{ji}$,因此协方差矩阵是一个对称矩阵


Copyright 2017-2019, All Rights Reserved.
粤ICP备18085907号 深圳市磐创网络科技有限公司

Documentation built with MkDocs.