看教材《计量经济学导论》(伍德里奇那本)时有点疑问自己想不明白,来论坛上请教下:
1. 第13章 13.4小节,用两期面板数据做政策分析中提到一个例子,研究在职培训津贴(grant)对产品报废率(scrap)的影响。使用的JTRAIN.dta数据。
书中分别用scrap的水平值做差分,scrap对数转换后的值做差分,作为因变量做回归。但是水平值的差分做因变量的模型中,∂grant的系数没有显著性,用对数值的差分做因变量的模型中,∂grant的系数有显著性。我理解这两个模型回答的研究问题一样,为什么模型结果会有这么大区别?
比较log(scrap)作为因变量的一阶差分模型和混合OLS模型(解释变量中遗漏工人能力)的结果,混合OLS的回归系数为正,且统计不显著。书中提到“这示意我们能力低的工人更有可能领取到一份津贴”,也就是工人能力和领取津贴负相关。这里比较模型回归系数的方向、大小和显著性判断可观测的自变量和不可观测的遗漏变量的关系的思路是怎样的呢?我自己有个推倒思路,但是有点绕,想知道标准的分析思路是什么样。
2. 紧跟着前面问题对应的正文下面,有个例题13.7,酒后驾驶法对交通伤亡事故的影响,用的1985年和1990年的数据(TRAFFIC1.dta)。例题是用交通事故死亡率(每行驶1万公里的交通事故致死人数)的水平值做差分后回归,得到开瓶法的系数是0.42,也就是说采用开瓶法,能使每行驶1万公里交通事故的致死人数减少0.42人?这种说法对吗?
文中接着提到,“1985年的平均死亡率为2.7,标准差为0.6,0.42是一个不容忽略的下降”。我认为:0.42/2.7=15.6%,就是采用开瓶法能使每行驶1万公里交通事故致死人数降低15.6%。
然后我自己将交通事故死亡率做了对数转换,然后取差分做回归。我理解的这个回归系数解释应该是:采用开瓶法能降低交通事故死亡率的百分比。
命令是这样:
得到copen的回归系数是 -0.08283,标准误 0.0858107,P=0.339。解释是采用开瓶法能使交通事故死亡率(每行驶1万公里交通事故致死人数)降低7.9% [exp(-0.08283)-1]。并且这个系数不显著。
使用水平值差分进行回归,得到系数后转换成改变Y的百分比,和使用对数值差分进行回归,系数也反映了改变Y的百分比,为什么两个差异会这么大(前者15.6%,后者7.9%)?并且系数的显著性为什么也差的很大?
教材正文和相应的数据在附件中。相关内容在pdf里高亮了。