本人菜鸟一个,由于毕业论文需要,不得不自学stata10.0,其中遇到很多问题,烦请各位高人指点,不胜感激。
lnxij = a + blnYi + clnYj + dlnPYi + elnPYj + flnDIS + gCONT + hFTA + iLANG + u
Xij :从国家i到国家j某行业(如食品行业)的出口价值,数据采用2005-2008年中国出口到其他10个国家的贸易总量
Yi:国家i GDP(PPP)
Yj:国家jGDP(PPP)
PYi:国家i人均GDP(PPP)
PYj:国家j人均GDP(PPP)
DIS:两国之间的距离(google earth)
CONT :是否接壤
LANG:是否语言相同
FTA:自由贸易协定
其中 i 均表示中国
问题1:由于采用DIS、CONT、 LANG、 FTA等一系列不随时间变化的自变量,是否就应该使用随机效应模型?而使用固定效应模型回归时,这些变量的结果都是dropped。
问题2:随机效应模型命令及回归结果如下:
insheet using "C:\Users\Jiangsu\Desktop\食品1.txt"
(11 vars, 44 obs)
. xtset country year
panel variable: country (unbalanced)
time variable: year, 2005 to 2008
delta: 1 unit
. xtreg xij yi yj pyi pyj dis cont fta lang, re
Random-effects GLS regression Number of obs = 40
Group variable: country Number of groups = 10
R-sq: within = 0.7537 Obs per group: min = 4
between = 0.7480 avg = 4.0
overall = 0.7481 max = 4
Random effects u_i ~ Gaussian Wald chi2(8) = 94.14
corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000
------------------------------------------------------------------------------
xij | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
yi | 18.53812 10.20624 1.82 0.069 -1.465742 38.54198
yj | .1451341 .4193615 0.35 0.729 -.6767993 .9670674
pyi | -18.4059 10.3352 -1.78 0.075 -38.66252 1.850724
pyj | .2913014 .4426809 0.66 0.511 -.5763373 1.15894
dis | -2.06094 .7414466 -2.78 0.005 -3.514149 -.6077317
cont | -.8814619 1.28355 -0.69 0.492 -3.397174 1.63425
fta | -1.546117 1.135912 -1.36 0.173 -3.772463 .6802284
lang | 1.040403 2.348651 0.44 0.658 -3.562869 5.643674
_cons | -237.0308 142.8434 -1.66 0.097 -516.9988 42.93718
-------------+----------------------------------------------------------------
sigma_u | 1.1231883
sigma_e | .19832038
rho | .96976594 (fraction of variance due to u_i)
------------------------------------------------------------------------------
(1)yj,pyj,lang的P>|z|结果不显著,是什么原因?是gdp与人均gdp的多重共线性问题吗?如果是这样,应该怎样检验或者在不舍去自变量的情况下消除?如果将人均gdp用人口数代替,还有意义吗?
(2)yi的系数比较大,不符合食品行业的实际情况,而pyi的系数为负,也与实际情况不符合,另外常数项的系数为什么会这么大,看到其他人的回归结果都比较正常???
(3)panel variable: country (unbalanced)中的非平衡表示什么意思?
本人初接触stata,问的问题可能比较肤浅,请论坛的stata高人不吝赐教~~~~~~~~