我们可以把它拆解成两部分来理解:PVAR模型 和 固定效应。
1. 首先,什么是PVAR模型?
VAR(向量自回归):VAR模型用于分析多个时间序列变量之间的动态互动关系。它的核心思想是每个变量的当期值都依赖于所有变量(包括自己)的过去值(滞后值)。
- 例如:分析GDP增长率、通货膨胀率、利率三个变量之间的关系。今年的GDP增长可能受去年GDP、去年通胀和去年利率的影响。
Panel Data(面板数据):面板数据是同时包含时间维度和个体维度的数据。
- 例如:我们不是只研究一个国家,而是研究20个国家(个体维度),每个国家都有过去30年(时间维度)的GDP、通胀、利率数据。
PVAR(面板向量自回归):PVAR就是将VAR模型应用在面板数据上。它允许我们同时分析多个个体(如国家、公司、家庭)中多个变量之间的动态关系。PVAR模型的一个巨大优势是它既能捕捉变量之间的动态互动(时间维度),又能控制个体之间不随时间变化的差异(个体维度)。
2. 其次,什么是固定效应?
在面板数据分析中,“效应”通常指那些不随时间变化的个体特征。这些特征通常难以观测或度量,但会对因变量产生影响。固定效应是一种控制这些遗漏变量问题的方法。
个体固定效应:指的是每个个体独有的、不随时间变化的特征。
- 例子:在分析国家经济时,每个国家都有其独特的文化、制度、地理环境等。这些因素在短期内基本不变,但会显著影响该国的经济表现(如GDP)。美国的文化制度与德国不同,这会导致两国的经济基线水平不同。
时间固定效应:指的是所有个体共同面对的、不随个体变化的宏观时间冲击。
- 例子:2008年全球金融危机,这个冲击在2008年这一年影响了所有被研究国家(个体),但冲击本身在不同年份是不同的。
3. PVAR固定效应:两者的结合
现在,我们把两者结合起来。“PVAR固定效应”指的是在PVAR模型中纳入的、用于捕捉和控制个体或时间层面不随时间或不随个体变化的特异性因素的虚拟变量或通过变换消除的效应。
在PVAR模型中,我们主要关心的是个体固定效应。这是因为PVAR的核心是分析变量间的动态关系,而每个个体独特的、不变的特征会“污染”这种关系。
- 为什么必须处理固定效应?
如果不控制个体固定效应,那些不随时间变化的个体特征就会被纳入模型的误差项中。如果这些特征与模型中的解释变量相关,就会导致估计偏差,使得我们得出的变量间的动态关系(如脉冲响应)不准确。
4. 如何在PVAR模型中处理固定效应?
直接在模型中加入个体虚拟变量(如为每个国家设置一个0/1变量)会带来一个严重的技术问题:动态面板偏差。因为被解释变量的滞后项()与个体固定效应()相关,也会与误差项相关,导致估计不一致。
因此,计量经济学家发展出了两种主流的技术方法来“去除”固定效应:
前向差分(Helmert)变换:
- 这是目前最主流的方法(由Love & Zicchino, 2006的经典论文推广)。
- 它不是直接减去均值,而是通过一种特殊的变换,在去除固定效应 的同时,确保变换后的滞后解释变量与变换后的误差项不相关。
- 这种方法能最大程度地保留样本信息,是估计PVAR模型的
pvarsoc, pvar, pvarirf等Stata命令默认使用的方法。
组内均值差分(Within Deviation):
- 这是一种更直观的方法:将每个变量减去该个体在所有时间上的平均值。
- 这种方法虽然去除了固定效应,但会引入动态面板偏差,需要再用GMM等工具变量法进行估计。
总结
- PVAR固定效应:主要指PVAR模型中每个个体(如国家、公司)所具有的、不随时间变化的独特属性(如文化、制度)。
- 目的:控制这些属性,以防止它们导致模型估计结果出现偏差,从而更准确地揭示变量之间真实的动态互动关系(即一个变量如何随时间影响另一个变量)。
- 处理方法:由于技术原因(动态面板偏差),通常不直接加入虚拟变量,而是采用前向差分(Helmert)变换或组内差分后使用GMM估计等方法来有效去除固定效应。
所以,当你在文献或软件结果中看到“PVAR模型控制了个体固定效应”时,它的实际含义是:作者使用了上述某种技术方法,确保模型所估计出的因果关系,排除了各个国家(或公司、个人)自身那些永恒不变的特性所带来的影响。