内生性问题来源:
1.   遗漏变量,遗漏的该变量与自变量相关并进入误差项,从而导致自变量与误差项相关,出现内生性问题;
2.   测量误差,即Xk*=Xk+ek,ek进入误差项,从而导致内生性问题;
3.   反向因果关系,即自变量影响因变量,因变量反过来也影响自变量,也就是说Xk与ek相关,从而导致内生性。
4.    样本自选择:即我们选择的样本,例如加入工会与不加入工会本身与模型中的变量相关,也会导致内生性问题,因为可能工资更高、教育程度更高的人越倾向于加入工会。
内生性问题导致的后果:若存在内生性问题,仍用OLS回归估计的后果是系数估计有偏且不一致;
内生性检验:Hausman检验
 
内生性问题的解决:
1.   工具变量;
内生性问题的解决方法:工具变量(instrumentalvariable)估计[简称IV估计]
IV是指:假定我们有一个可观测到的变量Z,他满足以下两个假定:
1.Z与U不相关,即COV(Z,U)=0;
2.Z与X相关,即COV(Z,X)≠0.
IV的估计值:以双变量模型为例 Y=C1+C2X+U
其中X与U相关,因而用OLS估计有偏,现有X的工具变量Z
于是有COV(Z,Y)=COV(Z,C1+C2X+U)
=COV(Z,C2X)+COV(Z,U)
=C2COV(Z,X)
则有C2=COV(Z,Y)/COV(Z,X)
而OLS估计有C2=COV(X,Y)/COV(X.X)
因此,1.当X=Z时,两者将完全一致,换言之,当X外生时,它可用作自身的工具变量,工具变量即为OLS 估计量;2.若X与Z不相关,COV(Z,X)=0,则工具变量无法给出估计值。
2.   两阶段最小二乘(2SLS);
3.   广义矩估计(GMM);(GMM估计附带过度识别约束检验,即k个参数,l个约束条件,且l)k,l-k个约束即过度识别约束)