如果同方差假设满足并且残差项服从正态分布,beta的OLS估计值应该服从一个均值为beta,方差为sigma^2*(X'X)^(-1)的正态分布。但是我们无法直接做假设检验,因为我们不知道sigma的真实值是多少。但是我们可以得到一个sigma的OLS无偏估计值,表示为u'u/(n-k), 这里u表示残差的估计值,n为观测值的个数,k为外生变量X的个数。我们可以证明u'u/sigma^2 是一个服从卡方分布的变量,卡方分布的自由度为n-k。
根据上面所说的,T检验意味着我们需要构成这样一个统计量:
(正态分布的beta估计值-beta)/[sigma^2*(X'X)^(-1)]^(1/2)
t统计量= ---------------------------------------------------------------------
[u'u/sigma^2/(n-k)]^(1/2)
这时你可以发现,因为分子分母都含有sigma,我们就可以消除它,不考虑到底真是的sigma是什么,只用它的OLS估计值u'u/(n-k)和beta的估计值就可以进行假设检验。同样的,对于F检验,我们需要构造这样一个类似的统计量:
(正态分布的beta估计值-beta)'(正态分布的beta估计值-beta)/sigma^2*(X'X)^(-1)
F统计量= -------------------------------------------------------------------------------------------------
u'u/sigma^2/(n-k)
和T统计量相比,其实我们是对 (正态分布的beta估计值-beta)/[sigma^2*(X'X)^(-1)]^(1/2)做了平方,使得这个新变量服从了卡方分布(正态分布的平方与平方和都是卡方分布)。于是分子分母就是两个卡方分布(除以它们各自的自由度)的比值,服从F分布了。
如果存在异方差,你可以发现,你的beta的OLS估计值仍然服从正态分布,均值为beta;但是这个时候你的正态分布的方差变了,不再是sigma^2*(X'X)^(-1)了,而是sigma^2*(X'X)^(-1)*(X'omegaX)*(X'X)^(-1),omega是一个矩阵但不在是单位矩阵(同方差)。这时sigma的OLS估计值
u'u/(n-k)是有偏的而且不在服从卡方分布了。根据上面的叙述,无论是T还是F统计量的构成都需要sigma的估计值服从卡方分布,如果这个无法证明,那么所构成的统计量就无法证明是服从t或者F分布的,也就是这两个检验失效了。
至于为什么u'u/(n-k)不在服从卡方分布,是一个比较复杂的证明,但是也不是非常复杂。首先,你的搞懂一个习题如下。
根据这个习题,你可以发现上文的残差项可以对应习题中的X,如果残差项不能服从一个均值为零,方差为sigma(或者sigma*I)的正态分布,我们就无法证明sigma的估计值服从一个卡方分布。
希望对你有帮助。