横截面遇到的问题及需要的检验大概有:异方差,多重共线性,对数形式,不同组结构改变,函数形式误设,内生问题等。
一、OLS基础(chapter1-chapter5)
1、方法:最小化残差平方和,再取导数(u是误差,u尖尖是残差)
2、结果:β=(X’X)-1X’Y
3、六个经典假设:
MLR.1: 线性; MLR.2:随机抽样; MLR.3:条件均值为0;
MLR.4:无完全共线性; MLR.5:同方差; MLR.6:误差正态分布
满足MLR1~MLR4:β无偏
满足MLR1~MLR5:高斯马尔科夫成立,OLS is BLUE,var(βj)=σ2/SSTj(1-Rj2)
满足MLR1~MLR6:β正态分布,t、F统计量有效
4、推断(inference):t=(估计值-假设值)/标准误
p-value=0.0718, then at 7% level, fail to reject H0; at 8% level, reject H0.
F= [(SSRr-SSRur)/q]/[SSRur/(n-k-1)], SSRur为不受约束模型(长模型)的残差平方和
5、渐进性质(大样本性质,asymptotic property): 大样本可放松MLR.6
大样本下,即使MLR.6不满足,t、F也成立,LM test(与F作用一样)
判断估计值好坏的标准:
(i) 无偏性Unbiased(expectation):E[θ^]=θ;(ii) 有效性efficient(variance): minimum variance;
(iii) 一致性consistent(distribution): limProb(/θ^_θ/<ε)=1,for anyε, ε>0
如果满足不了(i),至少要满足(iii),(iii)是最起码的要求。
大样本下(n→∞):
满足MLR1~MLR4:β无偏且一致的
满足MLR1~MLR5:β具有最小的渐进方差且渐进正态分布,t、F可用,可以不要MLR.6
二、异方差
1.异方差的后果:与方差有关的都不成立了,MLR1-MLR4依然成立,不影响无偏和一致性
(1)OLS不再是BLUE,有效性不成立
(2)t、F、LM 不再成立,不能做显著性检验
2.检验方法
(i) robust standard error
reg y x
reg y x, robust
如果某变量的t值变化很大,且由显著变为不显著,则很可能有异方差
(ii)Breusch-Pagan:
H0:无异方差
reg u^2 x1,…xk
method a) test x1,…xk, See F statistic
p-value=0.002, reject H0,there is strong evidence of heteroskedasticity
method b) compute LM
di n*R^2
14.088
Scalar pval=chi2tail(n,14.088)
Di pval
0.002 ( reject Ho)
(iii)White:
reg u^2 yhat uhatsq
如果两个系数都显著,则表明很强的异方差
将模型全部换成log形式,再做上面三种检验,异方差可能减少,或消失
(iv)Goldfeld-Quandt:
3.纠正方法
(i) robust standard error:仅限大样本条件
reg y x, robust
do t,F,LM test, 此时的robust t,F(robust wald),LM都比OLS可靠,但是仅对大样本来讲
(ii) WLS(已知异方差形式):V(u/x)=inc2σ2 对线性、非线性都适用
OLS:reg sav inc size educ age black
WLS:reg sav inc size educ age black [aw=1/inc]
(iii) FGLS(不知道异方差形式): 可以用于大小样本,但是不一定准
reg y x
predict ub, resid
gen lubar=log(ub*ub)
qui reg lubar y x
predict newyhat,xb
gen newyhatse=exp(newyhat)
reg y x [aw=1/newyhatse]
三、多重共线性(multicollinearity)
1.症状:R^2很大;一些被认为重要的变量不显著;F显著而t却不显著
2.检验方法:vif
reg y x1 x2 x3 x4
vif
if vif >10, there is evidence of multicollinearity
3.解决办法: drop one
Corr x1 x2 x3 x4,看出哪个和其他的相关性强,将其去掉
Collin x1 x2 x3 x4
去掉vif最大的一个,如x4
reg y x1 x2 x3
vif 此时vif 很可能〈10
四、log形式与函数形式误设(FUNCTIONAL FORM)
1.log的解释:
logy=9.23-0.718logx1+0.306x2
0.718:when x1 increase 1%, y will decrease by 0.718%,with x2 fixed;
0.306:when x2 increase 1, y will increase by 30.6% with x1 fixed
2.使用log的原因
解决非线性模型估计;解释弹性;去掉异方差;
3.检验应不应该用log(RESET):
(1)看看哪个好 reg y x 与 reg logy logx
reg y x
reg y x yhat^2 yhat^3
test yhat^2 yhat^3俩的系数为0,do F test
if fail to reject ho, there is no functional form misspecification, 非log好
Do the same steps for logy on logx
(2)看看哪个好 i:reg y x
ii: reg y logx
方法1:reg y x logx
test x的所有系数是否都为0,do f test
if fail to reject h0, use ii; if reject ho, use I;
方法2:reg ii first, get yhat
reg y x yhat
t test if yhat 的系数为0,if fail to reject, use i; reject, use ii
五、不同组的结构改变(CHOW TEST)
1.检验哑变量是否影响解释变量系数(斜率)
假设v1,v2是哑变量
reg y, x1, x2, v1, v2, v1*x1, v2*x1, v1*x2, v2*x2
F检验最后两个变量的系数都是0
If fail to reject h0, dummy variables have no effect on independent variable
2.结构改变检验(chow test)
看看两个样本(两组data)是否适合用于同一个模型,通常以某时间分开样本,看前后有没有结构改变,即模型系数有没有改变。
F= [(SSR-SSR1- SSR2)/(k+1)]/[( SSR1+SSR2)/(n-2k-2)]
H0:there is no structural change
六、内生问题(ENDOGENEITY)see Instrument Variable