1.工具变量
在模型估计过程中被作为工具使用,以替代模型中与误差项相关的随机解释变量的变量,称为工具变量。
作为工具变量,必须满足下述四个条件:
(1)与所替的随机解释变量高度相关;
(2)与随机误差项不相关;
(3)与模型中其他解释变量不相关;
(4)同一模型中需要引入多个工具变量时,这些工具变量之间不相关。
2.工具变量法
选择一个变量,作为模型中某随机解释变量的工具变量,与模型中的其他变量一起构造出相应参数的一个一致估计量,这种估计方法称为工具变量法。
设一元线性回归模型 ,普通最小二乘法是通过求解下列正规方程组来估计模型参数的:
(3.4.1)
该正规方程组是这样形成的:首先用每个解释变量(系数 对应的解释变量为1)分别乘模型两边,并对所有样本点求和:
(3.4.2)
当假定 成立时, ,因此可以舍去(3.4.2)式中第一方程的 项和第二个方程的 项,从而,得到正规方程组(3.4.1)式。
现在考察随机解释变量与误差项相关的情况:当 时,我们就无法从(3.4.3)式中的第二个方程得到(3.4.1)式中的第二个方程,也就无法得到参数的一致估计量。因此我们考虑用变量Z作为随机解释变量X的工具变量,在(3.4.2)式样不用X乘方程两边,而用Z代替X乘方程两边,使(3.4.2)式变为:
(3.4.3)
按照工具变量的标准, ,则 ,据此我们就可以从(3.4.3)式得到如下正规方程组:
(3.4.4)
求解正规方程组(3.4.4)式,即得到原模型的工具变量估计量为:
(3.4.5)
因此,工具变量法的基本原理在于:有工具变量Z代替随机解释变量X,从而利用 克服 产生的对模型参数估计的不利影响,形成有效正规方程组并最终获得模型参数的估计量。
从这一原理去理解,普通最小二乘法也可以看作为是一种工具变量法,即用模型中的各解释变量作为它们自身的工具变量。
3.工具变量估计量的性质:一致估计量。
对 两边取概率极限得:
说明大样本条件下,工具变量估计量是参数的一个一致估计量,但在小样本条件下,由于一般 ,所以 是有偏的。
4.工具变量法的关键:工具变量的选择。
如前所述,作为工具变量(Z)必须符合四项基本条件: 的值高;与模型中其他解释变量不相关;与引入模型中的其他工具变量不相关。凡是符合这些条件的变量Z均可作为Z的工具变量。
实际分析中,一般的做法是:
对于时间序列资料:如果被解释变量(Y),随机解释变量(X),误差项( )三者之间的关系有: ,但 ,则可用 或 作为Xt的工具变量。
对于横截面数据资料:一般用组平均法,即依据随机解释变量(X)观测值的相对水平来确定工具变量(Z),具体有:
瓦尔德法:
巴特莱特法:
德宾法:Z=i i为X观测值从小到大的顺序号
5.工具变量法的缺陷。
(1)由于工具变量不是惟一的,因而工具变量估计量有一不定期的任意性。
(2)由于误差项实际上是不可观测的,因而要寻找严格意义上与误差项无关而与所替代的随机解释变量高度相关的变量事实上是困难的。