一、内生解释变量与工具变量法
    内生解释变量会造成严重的后果:不一致性inconstent和有偏biased,因为不满足误差以解释变量为条件的期望值为0。产生解释变量内生一般有三个原因:
    1、遗漏变量
    2、测量误差
    3、联立性
    第三种情况是无法解决的,前两种可以采用工具变量(IV)法,IV带来的唯一坏处是估计方差的增大,也就是说同时采用OLS和IV估计,则前者的方差小于后者。但IV的应用是有前提条件的:1.IV与内生解释变量相关,2.IV与u不相关。在小样本情况下,一般用内生解释变量对IV进行回归,如果R-sq值很小的话,一般t值也很小,所以对IV质量的评价没有大的问题,但是当采用大样本时,情况则相反,往往是t值很大,而R-sq很小,这时如果采用t值进行评价则可能出现问题。这时IV与内生解释变量之间的相关程度不是太大,但是如果与u之间有轻微的相关的话,则:1.导致很大的不一致性;2.有偏性,并且这种有偏性随着R-sq趋于0而趋于OLS的有偏性。
    所以现在在采用IV时最好采用R-sq或F-sta作为评价标准,另外为了观测IV与u的关系,可以将IV作为解释变量放入方程进行回归,如果其他的系数没有大的变化,则说明IV满足第二个条件。
    注:内生性——扰动项与解释变量相关;
        自相关—— 序列相关(serial correlation)是指总体回归模型的随机误差项之间存在相关关系 。DW检验,LM检验。 
       上述的R-sq和F-sta都是结构模型中的。
 
    二、如何判断工具变量是否合理
    甲:一个计量方程 y =a + bx +u, x如果有内生性,则需要找一个工具变量z。理论上来说,工具变量Z必须与残差项U不相关,与被工具的变量X相关。但是x与u是相关的。实际上u总是会通过影响x来影响z的(因为u与x相关而x与z相关)。请问,这算不算工具变量z与残差项u相关,从而导致工具变量z无效?我考虑,这个u与z之间的影响是间接的。是不是只要不是直接的影响就可以?因为间接地影响好像是必然存在的。
比如说,阿西莫格鲁那篇著名的关于制度与经济增长的论文,把殖民时代的死亡率作为工具变量,但如果其他影响经济增长的因素通过影响殖民时代的制度来影响殖民时代的死亡率,那么死亡率这个工具变量不还是和残差项相关吗?
   乙:我跟你的理解不一样。X是内生变量,说明在X背后有一个或者多个外生变量可以解释X,你所谓的那个工具变量Z就是那个主要解释X的外生变量。如果你可以找到这个解释X的外生变量,那就可以使得X与Z相关(因为可以建立X=a+bZ这样的回归方程,那肯定相关),另外直接用X解释Y的话,因为X是内生变量(也就是个二传手),Z这个外生变量被包含在误差项里面了,所以误差项与X会相关。但是你如果已经把Z给找出来了,并用工具变量法进行二阶段回归或者GMM的话,那么内生性问题就被消除了。单方程回归分析的解释变量只能是外生变量,如果存在二传手(内生变量)那么就需要多一步建立外生变量(工具变量)与那个内生变量的关系(即工具变量对内生变量的回归方程,然后使用方程估计值取代原来的内生变量进行原方程的回归)。
    所以找工具变量是需要很强的理论知识的,工具变量一定是外生变量,如果还是找个内生的变量那就没有意义了,多了个三转手罢了。
   
    甲:你好像没回答我的问题,“如果已经把Z给找出来了,并用工具变量法进行二阶段回归或者GMM的话,那么内生性问题就被消除了”。可是得先确定z与误差项不相关,才能找出合适的z啊。我的问题就是,如果误差项通过影响x来影响z的(因为误差项与x相关而x与z相关),此时我找出的z还是不是合适的工具变量。
 
    乙:误差项只是包含Z,不是影响Z。误差项包含了Z,Z与X相关(并且Z是X的原因),所以从现象上看就变成X与误差项相关了。你找到的Z跟误差项无关,跟X相关,而且从理论上解释得通,那么就可以当工具变量来用。另外工具变量一定要是外生变量,它只能影响别人不能被别人影响,也就是它只能是原因不能作为结果。(不然内生性问题还是没有解决)
 
    甲:“误差项只是包含Z,不是影响Z。误差项包含了Z,Z与X相关(并且Z是X的原因),所以从现象上看就变成X与误差项相 ...”可是误差项完全有可能包含z之外的影响x的因素啊,也就是影响x的因素可能不止z一个啊,那样的话这个z以外的误差项包含的因素,不就可以通过与x相关进而与z相关了吗?这样工具变量z不就无效了吗?
    乙:我个人觉得因为这里的Z也可以是范指,当然误差项可能包含多个外生变量。一般不可能100%穷尽所有的可以影响X的外生变量,误差项与X的相关性小到一定程度就可以收手了。Z变量需要是外生变量,如果误差项里面还有其他的因素可以影响Z变量,那就说明Z变量也是内生变量,这就是一个多层次的因果关系了,在因与果之间有多重的中间变量。呵呵~我牛角尖就钻到这一步了,头晕了。接下来等待其他高人的见解了!
本文来源:http://blog.sina.com.cn/s/blog_53c8aa980100xjbj.html