三、相关系数的性质
定理:设ρxy是RV X,Y的相关系数,则有:|ρxy|≤1;|ρxy|=1 ó X,Y以概率1线性相关,即P(Y=ax+b)=1, P(Y≠ax+b)=1
注意:Y=Ax+b => |ρxy|=1
预备定理:柯西-许瓦兹不等式,V W是任意的RV,若E(V2)<+∞,E(W2)<+∞,则有E(VW)2≤E(V2)E(W2)等式成立,当且仅当P(V=t,W)=1
证明:造一个函数,U(t)=E(V+Tw)2=E(V2)+2tE(VW)+t2E(W2)≥0
, 得到E(VW)2≤E(W2)E(V2)
性质1:ρ2xy=E2[(X-EX)(Y-EY)]/[D(X)D(Y)]
令V=X-E(X), W=Y=E(Y),式子变为:ρ2xy=[E2(VW)]/[E(V2)E(W2)],就是柯许不等式。
D(V)=D(X-EX)=D(X)+D(EX)=DX (1)
D(V)=E(V^2)-(E(V))^2, EV=E(X-EX)^2=0,得到DV=E(V^2) (2)
由(1),(2)得到:D(X)=E(V^2), 同理,D(Y)=E(W^2)
当U(t)=0时,U(t)=E(V+Tw)^2, 又E(V+Tw)=0, 所以EV=EW=0
D(V+tW)=0 ó P(V+tW=0)=1, P(V+tW≠0)=0,P(X-EX+t(Y-EY)=0)=1, P(Y=-X/t+EX/t+EY)=1
结论:当0<|ρxy|<1时,说明X,Y之间有或弱或强的线性关系;|ρxy |->1,线性关系越强;当0<ρxy->1是正相关关系,当0>ρxy->-1 负相关。|ρxy |->0时,线性关系较弱。
定义:若ρxy=0,称X,Y不相关(或者X,Y无关,有非线性关系或者其他关系。
X,Y独立,且DX,DY有限,则X,Y不相关;
反之,XY不相关,是否独立呢?
例:若X,Y在以o为中心,R为半径的圆上均匀分布,问X,Y是否独立?是否不相关?
解:(X,Y)~ f(x,y)=1/(ПR^2) x^2+y^2≤R^2, 0 其他。X~ fx(x)= , Y~ fY(y)=
fx(x)*fY(y)≠f(x.y),因此不独立。
E(x,y)=
E(x)=
D(X)=E(X2)-(EX)2=E(X2)= , 同理D(Y)<+∞, COV(X,Y)=E(XY)-EXEY=E(XY)=0
因此X,Y不独立也不相关。
例:若Y=aX+b,证明ρ|xy|=1
证明: cov(X,Y)=E[(X-EX)(Y-EY)]
ρxy=cov(X,Y)/[D(X)^0.5*D(Y)^0.5]
EY=Aex+b
DY=D(ax+b)=a^2DX
Cov(X,Y)=E[(X-EX)(aX+b-E(aX+b))]=AE[(X-EX)^2]=a2D(X)
得到|ρxy|=|aD(X)/DX^0.5*|a|*DX^0.5|=1
例:设U=aX+b, V=Cx+d (a>0, c>0), 求证:ρxy=ρuv
E(U)=E(aX+b)=aE(X)+b
D(U)=a^2D(X)
E(V)=cE(Y)+d, D(V)=c^2D(Y)
ρuv=cov(U,V)/(DU^0.5*DV^0.5)
cov(U,V)=E[(U-EU)(V-EV)]=E[(aX+b-(aEX+b))(cY+d-(cEY+d))]=AE[(X-EX)(Y-EY)]=acov(X,Y)
得到ρuv =a cov(U,V)/(aDX^0.5*DY^0.5)= cov(U,V)/(DX^0.5*DY^0.5)= ρxy
例:证明RV X,Y, D(X)=25, DY=36, ρxy=0.4, 求D(X+Y), D(X-Y)
解:D(X±Y)=DX+DY±2cov(X,Y), ρxy=cov(X,Y)/[D(X)^0.5*D(Y)^0.5],
所以cov(X,Y)= ρxy*[D(X)^0.5*D(Y)^0.5=0.4*5*6=12
D(X±Y)=25+36±24, D(X+Y)=85, D(X-Y)=37
例:RV X~ П(4), Y~ B(100, 1/5), Z=2X-3Y, ρxy=1/4, 求ρxz
解:DX=EX=4 (泊松分布的期望值等于方差)
E(Y)=100*1/5=20, DY=100*1/5*4/5=15
ρxz=cov(X,z)/[D(X)^0.5*D(Z)^0.5],
DZ=D(2X-3Y)=4DX+9DZ-2cov(2X,3Y)=4*4+9*16-2*2*3*2=136
EZ=E(2X-3Y)=2EX-3EY
Cov(X,Z)=E[(X-EX)(Z-EZ)]=E[(X-EX)(2X-3Y-(2EX-3EY))]=E[(X-EX)(2(X-EX)-3(Y-EY))]=E[2(X-EX)^2-3(X-EX)(Y-EY)]=2DX-3cov(X,Y)=2DX-ρxy*D(X)^0.5*D(Y)^0.5,
ρxz=cov(X,Z)/[DX^0.5*DZ^0.5]=
(2DX-3ρxy*(DX^0.5)*(DY^0.5))/(DX^0.5*DZ^0.5)=1/(2*34^0.5)
用性质:cov(X,Z)=cov(X,2X-3Y)=cov(X,2X)-cov(X,3Y)
=2cov(X,X)-3cov(X,Y)=2DX-3cov(X,Y)=2DX-3ρxy*DX^0.5*DY^0.5