考虑一个简单的模型:
Y=a+b*X+e
如果X和e相关,则X被称为内生变量。此时用OLS估计的a和b不是一致(consistent)的。
假设有一个工具变量Z满足:(a) E(Ze)=0 (b) Corr(Z,X) 不等于0,
则可以得到: Corr(Z,Y) = b*Corr(X,Z) 然后可以从这个等式可以推出b的估计量
这就是工具变量的思想。
当你有多个内生变量和多个工具变量时,还需要满足(c) 工具变量个数>=内生变量个数。
其中, 工具变量个数=内生变量个数 时,就得到了工具变量(IV)估计值;
而当 工具变量个数>内生变量个数 时,就需要使用广义矩(GMM)估计值。