在进行政策评估时,使用虚拟变量(dummy variable)确实是一个常见且有效的方法。当想研究某项政策的影响时,设置一个表示政策实施与否的虚拟变量是个好主意,比如你提到的以2008年为界的情况。
如果模型是这样的:
\[y = a_0 + a_1x + a_2z + e\]
其中 \(z\) 是你的虚拟变量(对于改革前=0,改革后=1),那么这个模型实际上是在考察自变量 \(x\) 对因变量 \(y\) 的平均影响,以及政策改革自身对 \(y\) 平均水平的影响。
但是,如果想具体分析政策是否改变了 \(x\) 对 \(y\) 影响的大小(即交互效应),你需要在模型中加入 \(x\) 和 \(z\) 的乘积项,也就是交互作用项。这样的模型如下:
\[y = a_0 + a_1x + a_2z + a_3(x \times z) + e\]
其中,\(a_3\) 代表的是政策实施后,\(x\) 对 \(y\) 影响的改变量。
至于是否可以去掉虚拟变量 \(z\) 的单列项,这取决于你的研究目的。在上面提到的交互模型中,保留 \(z\) 可以帮助你了解改革对因变量是否存在独立的影响(即政策实施本身对结果是否有直接效应)。但是,在一些情况下,如果你仅关心自变量与政策改变之间的交互影响,理论上可以考虑不包括 \(a_2z\) 项。不过,通常的做法是包含所有相关的主效应和交互效应,这样可以使模型解释更全面。
因此,根据你描述的情况:
\[y = a_0 + a_1x + a_3(x \times z) + e\]
这样的设定理论上是可以的,但可能会忽略政策本身可能存在的直接效应。实践中,建议包含 \(z\) 的单独项以获得更完整的分析结果。
\[y = a_0 + a_1x + a_2z + a_3(x \times z) + e\]
这是进行交互作用检验的标准方式,并能提供政策影响的全面解读。
总之,在实际操作中,建议首先包括所有的主效应和交互项,然后根据理论假设和模型结果来决定是否简化模型。
此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用