在使用Stata的`xtabond`命令时,对于动态面板数据模型(Dynamic Panel Data Model),其工具变量数量的计算方式可能会比直观上预期的要复杂一些。
以你提到的情况为例:一个8年的面板数据集,并且假设你要构建的是差分GMM(Difference GMM)估计,其中考虑了AR(1)滞后自回归。在差分GMM中,当前期的变量会作为下一期的内生解释变量,而它的工具变量则通常由这个变量更早的时期值构成。
具体到你的情况:假设有8个年份的数据,那么对于每个个体来说,最晚我们能使用的滞后项是t-7(因为从第1年开始,到最后一年我们需要一个滞后来构建差分)。但是,在差分GMM中,除了考虑滞后期外,还要考虑到差分这一操作。例如,在AR(1)模型下:
1. 你有8年的数据。
2. 第一年没有工具变量(因为你不能滞后到第0年)。
3. 从第二年开始,每个时期都有t-1的滞后项作为工具变量;
4. 因为是差分GMM,第一期的变量会被差分掉,所以我们从第二期开始计算。这意味着对于第2年来说,我们有1个工具变量(即第1年的该变量)。
5. 对于每一年,你都将前一年的数据作为工具变量。
所以:
- 第2年:1个工具变量 (t-1)
- 第3年:2个工具变量 (t-1, t-2)
- ...
- 第8年:7个工具变量 (t-1到t-7)
当你将这些加起来时,实际上你是在计算前n项的自然数之和(这里n=7),这等价于(n*(n+1))/2。因此对于第8年的数据,我们有(7*8)/2 = 28/2 = 14个工具变量。
然而,你的问题是关于差分GMM中的总工具变量数量。在差分GMM中,除了上述的滞后项作为工具变量外,通常还会额外包含一个“水平”方程(level equation),在这个方程里使用更早时期的滞后值来解决差分模型可能带来的偏误问题。
因此,你看到的实际工具变量数22可能是由两部分组成:
1. 用于差分GMM的滞后期工具变量数量:(7+6+5+4+3+2+1) = 28/2 = 14
2. 另外加上用于水平方程中的更早时期滞后值,可能再有8个(即从第1年到第8年的每个年初的滞后值)。
不过,在实际操作中,由于Stata的具体实现细节或模型设定的不同,工具变量的数量可能会因具体情况而异。但一般而言,计算时需要考虑到差分GMM中两个方程的需求:一是差分方程,另一个是水平方程(也称为system GMM)。所以总数量可能比直接相加滞后期望值要多出一些。对于具体的数值为何为22,你可能需要更细致地检查你的命令设定和Stata的输出来确认每一个工具变量是如何被纳入模型中的。
此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用