问题具体如下:我有一组包含2000多个个体,跨越10年的非平衡面板数据,两个因变量y1,y2,一个自变量x(哑变量),和其他的控制变量z。
按理论期望的结果是:H0:y1和x正相关,y2和x负相关。
我用相关系数分析pwcorr_a y1 y2 x,得到了H0
我用分组差异分析ttable2 y1 y2, by(x),得到了H0
我用OLS混合回归+稳健标准误,命令是reg y x z,vce(cluster id)),得到了H0
但是当我用固定效应模型,命令是xtreg y x z,fe r,却得到了H1(y1和x负相关,y2和x正相关)。
当我用陈强老师的检验命令
①混合回归or固定效应回归
xtreg y x z,fe得到的F检验说明不接受混合回归(但这种混合回归检验没用聚类稳健标准误,是不是有时不可信?)
②固定效应or随机效应
xtreg y x z,re r theta,检验说明不接受随机效应。
对于大部分命令,非平衡面板和平衡面板都可以处理,且方法相同。为了尽可能多地保留数据中的信息,尽量不要把非平衡面板整理成平衡面板。固定效应回归和混合回归的区别在于,固定效应回归可以控制仅随个体变化的不可观测变量,一定程度上解决遗漏变量偏差问题。至于你刚刚说的固定效应和混合回归之间的权衡,用聚类稳健标准误时不汇报F值,可以用以下的方法来改进:
固定效应回归:reg y x z i.id, vce(cluster id),然后检验个体虚拟变量的联合显著性。但请注意联合显著性的定义,只要至少有一个不为0,就可以拒绝原假设,在这种情况下,几乎是肯定要拒绝原假设的,因此很少有人在固定效应回归和混合回归之间进行权衡,直接选择固定效应回归的居多。