在解决潜在的内生性问题时,
对于无法观测到的因素对于结果的影响,
常用的方法之一是计算Inverse Mill's Ratio
但是,目前诸多关于Inverse Mill's Ratio的应用(尤其是在公司金融和会计的实证研究领域),
有一个显著的错误,那就是忽视了Inverse Mill's Ratio 只能用于主回归是线性模型的情况。
如果主回归是非线性的,比如:Cox hazard model, logit regression, probit regression, tobit regression 等等,都不可以直接用
Inverse Mill's Ratio来解决由不可观测的因素造成的内生性问题。
比如:
Y=a+b1*X1+b2*X2+e1 ....(1)
Y是一个公司是否成功上市1/0。
X2是这个公司是否曾获得风险投资VC支持。
X1是此公司的其他特征控制变量。
如果怀疑X2一个公司是否有风险投资支持,是受观测不到的因素影响的(比如这个公司的管理水平,或者是这个CEO的创新能力),
而这些观测不到的因素又同时会影响最终结果Y--这个公司是否最终成功上市
如果按照传统办法,找到一个工具变量Z(例如这个公司所在地区当年占全国风险投资总量的百分比,比例越高,这个公司越容易获得风险投资)
X2=c+d1*X1+d2*Z+e2
并计算Inverse Mill's Ratio,(具体计算过程省略,如果需要,我会专门开一个帖子,介绍计算方法)
并把这个ratio作为一个新的变量插入原回归(1)中,则会存在极大的问题。
关于具体存在的计量学问题,伍德里奇2010版里有详细讨论。
Wooldridge, J. M. (2010). Econometric analysis of cross section and panel data. CambridgeMA: MIT press
既然在结果变量Y和内生变量X2都是哑变量dummy 1/0时,无法直接用Inverse Mill's Ratio 的办法来解决,
那么是否存在现成的可以应用的命令来解决这个问题呢?
Stata中的eteffects为我们提供了一个比较完美的解决办法。
在此命令的说明中,有明确表示:此命令适用于主回归为非线性模型的情况。
因此,如果你的主回归模型是logit, probit, Cox hazard等等,
同时又有一个内生变量为dummy,
那就不要再在Inverse Mill's Ratio上继续纠结了,来尝试一下eteffects吧。
2012之前发表的诸多论文,甚至是顶级期刊Journal of Financial Economics中,
还有很多学者错将Inverse Mill's Ratio 应用的非线性模型中。
各位在做新的研究时,务必要小心。