随机变量的数字特征

期望

$\int xp(x)dx$

复合随机变量的期望 $Y=g(x)$，那么 $EY=\int g(x)p(x) dx$
(然后，根据$DX=EX^2-(EX)^2$，可以计算$DY$)

对于多元复合函数，一样
$Z=g(X,Y)$，那么
$EZ=\iint g(x,y) p(x,y) dxdy$

数学期望的性质

$E(X+Y)=EX+EY$ 无论是否相互独立都成立
如果相互独立，则 $EXY=EXEY$

定理（柯西不等式）
如果$EX,EY,EX^2,EY^2$都存在，那么$[E(XY)]^2\leq EX^2EY^2$
证明：构造$E(\lambda X+Y)^2$，这个值恒为非负。
展开，用二次函数恒为非负的判定公式。

方差

定义：
$DX=E[X-EX]^2$

性质

$D(aX+b)=a^2DX$

$D(X+Y)=DX+DY+2COV(X,Y)$

协方差

定义：
（首先要求方差存在）$Cov(X,Y)=E[(X-EX)(Y-EY)]$

性质

$Var(X)=Cov(X,X)$
$Cov(X,Y)=Cov(Y,X)$
$Cov(aX,bY)=abCov(X,Y)$
$Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y)$
$Var(aX+bY)=a^2Var(X)+b^2Var(Y)+2abCov(X,Y)$
$Cov(X,Y)=EXY-EXEY$

条件期望和条件方差

（这里的$\sum$和$\int$是相通的，分别用于离散概率和连续概率，就只写一种）

条件概率

给定一个样本空间S，一个完全事件集合$\varepsilon=\{A \mid A \subset S\}$,一个概率测度 $Pr:\varepsilon \to [0,1]$，
给定事件$B\in \varepsilon,Pr(B)>0$,
那么，对于$A \in \varepsilon$，定义 条件概率 为$Pr(A \mid B)=\dfrac{P(A \cap B)}{P(B)}$

这种定义的好处是，$Pr(\star \mid B)$符合概率测度的定义

条件PDF

假设联合pdf是$f(x,y)$
定义：$f_{X\mid Y}(x\mid y)=\dfrac{f(x,y)}{f_Y(y)}$

定理： $f_X(x)=\sum\limits_{y} f_{X\mid Y}(x\mid y)f_Y(y)$

（下面就省略下标，例如$f_{X\mid Y}(x\mid y)$简写为$f(x\mid y)$，要知道$f(x),f(y),f(x\mid y)$是不同的函数，别弄混了）

条件期望

联合期望 定义为：
$E[g(x_1,x_2)]=\sum\limits_{(x_1,x_2)}g(x_1,x_2)f(x_1,x_2)$

条件期望 定义为：
$E[X \mid Y=y]=\sum\limits_{x} x f(x \mid y)$
记为$E(X\mid Y=y)$

注意:
$E(X\mid Y=y)$ 是自变量为$y$的函数
又记$E(X\mid Y)$ 是Y的函数，它本身是一个随机变量。

全期望定理(law of total expactation)

全期望定理(law of total expactation)
$E_{Y}[E_{X\mid Y}[X \mid Y]]=\sum\limits_{y}E(X\mid Y=y)f_Y(y)$
也就是说，
$E[X]=E[E[X \mid Y]]$

条件方差

方差定义为：
$E[(X-EX)^2]$
定理：
$Var(X)=EX^2-(EX)^2$

条件方差 定义为：
$Var(X\mid Y=y)=E[(X-E(X\mid Y=y))^2\mid Y=y]$

（上面的式子，右边代入定义，得到一个定理）
$Var(X\mid Y=y)=E(X^2\mid Y=y)-(E(X\mid Y=y))^2$

记$Var(X\mid Y)$是Y的函数，它本身是一个随机变量。得到一个定理
定理：$Var[X]=E[Var[X \mid Y]]+Var[E[X\mid Y]]$
证明过程，推荐在纸上推导一下细节。

第一项。$Var[X\mid Y]=E[X^2\mid Y]-(E[X\mid Y])^2$，然后用全期望定理
第二项。也是把方差转换为期望表示，然后用全期望定理

条件期望和条件方差汇总

$f(x\mid y)=f(x,y)/f_Y(y)$
$Var X =EX^2-(EX)^2$
$E(X\mid Y)=\sum\limits_x f(x \mid y)$
$Var(X\mid Y)=\sum\limits_x(x-u_{x\mid y})^2f(x\mid y)$
$EX=E(E(x\mid y))$
$VarX=E(Var(X\mid Y))+Var(E(X\mid Y))$

其它数学特征

距

k阶原点距 $EX^k$
k阶中心距 $E(X-EX)^k$

变异系数

$C=\dfrac{Var(X)}{EX}$

中位数和分位数

中位数$F(x)=0.5$的解
下分位数$F(x)=a$的解
上分位数$F(x)=1-a$的解

众数

众数就不多说了。

多元随机变量：矩阵表示

$x=\left ( \begin{array}{ccc} x_1\\x_2\\x_3\\...\\x_k \end{array} \right ), y=\left ( \begin{array}{ccc} y_1\\y_2\\y_3\\...\\y_k \end{array} \right )$是随机变量矩阵
a,b是常数， $c=\left ( \begin{array}{ccc} c_1\\c_2\\c_3\\...\\c_k \end{array} \right ), d=\left ( \begin{array}{ccc} d_1\\d_2\\d_3\\...\\d_k \end{array} \right )$是常数向量
$A,B$是矩阵

那么有这些结论：

1. 定义均值和方差

$Ex=\left ( \begin{array}{ccc} Ex_1\\Ex_2\\Ex_3\\...\\Ex_k \end{array} \right )$
定义:$cov(x,y)=(cov(x_i,y_j))_ {p\times p}$

2. 线性组合

$E(ax+c)=aEx+c$
$D(bx+c)=b^2Dx$

$E(Ax)=AE(x),E(x^TA^T)=E(x^T)A^T$
$cov(c^Tx,d^Tx)=c^T D(x) d$
（所以$D(c^Tx)=c^T D(x) c$）

3. 线性组合plus

$cov(y,x)=(cov(x,y))^T$
$cov(Ax,y)=A cov(x,y)$(用定义展开立即可证)
$cov(x,By)=(cov(By,x))^T=(Bcov(y,x))^T=(cov(y,x))^TB^T=cov(x,y)B^T$

由上面两个式子，
$cov(Ax,By)=Acov(x,y)B^T$