合成控制法,双重差分法,断点回归法等是政策效果分析最为流行的方法,合成控制法相对于其他两种方法的有点在于可以更好的分析某政策或事件对一个地区的影响,并将政策的效果形象的展示出来,如果你的实验组个数较少,选择合成控制法可能是一个非常好的选择。
接下来使用一套演示数据来展示该方法的一些stata实现步骤
数据说明:因变量为人均收入(lnpgdp),控制变量为第二产业占比(second)、第三产业占比(third)、ZF预算支出与GDP比例*100(gov)、基础设施水平(ic(公路里程/行政区域面积)×100)、人口密度(pd)。2000-2019年 政策开始年份为2009年,实验组为id 1-111的城市 实验组为id 112的城市。
第一步:根据控制组城市构造实验组的反事实情况(stata命令在最下面)
计算实验组(id=112)的合成比例:如表1所示,结果表明反事实结果由id为39、84、85、86、95、101、106、108、110的城市以Unit_Weight的比例构成。
表1 合成比例
表2结果表明控制变量在实验组和反事实中非常接近,初步表明拟合结果很好。
表2 控制变量在实验组和反事实的大小对比
图1 为合成控制法的结果,实线为实际情况下id=112的城市的人均收入走势,虚线为反事实情况下人均收入走势,从政策之前两条曲线的走势可以看出两条曲线几乎重合,表明拟合效果非常好,政策之后可以看出该政策显著促进了id=112的城市人均收入的增加,如果没有该政策,id=112的城市的人均收入只会按照虚线走,正是由于政策的存在才使得该城市政策按照实线发展。
图1 合成控制结果
图2绘制了图1两条曲线之间的差距,政策之前该曲线几乎为0,表明该拟合效果较好,后面的变化可以反映反事实情况。政策之后事实远超反事实,表明政策起到了正向效果。
图2 事实与反事实之间的差值
第二步安慰剂检验
为了避免结果是否完全是由偶然因素驱动的,参考刘甲炎和范子英研究将每个控制组城市都假设为政策执行城市,分别对他们做一次合成控制。图中灰色的线表示112个原本捐赠池中的城市作为实验组进行测试的结果,即灰色的线表示了控制组中每个城市的人均GDP与其对应的反事实之间的差值,红色的线反映了id=112城市与其反事实人均GDP的差值。可以看出该红色线在所有线的最外面,可以初步认为id=112城市的人均GDP增加是由政策带来的。如果想真正确定还需计算Post-Period MSPE与Pre-Period MSEP的比值。
[1]刘甲炎,范子英.中国房产税试点的效果评估:基于合成控制法的研究[J].世界经济,2013,36(11):117-135.
图3 安慰剂检验
为了更加明显的看出安慰剂检验效果,参考苏治等(2015)的研究计算实验组及其所有控制组城市的Post-Period MSPE与Pre-Period MSEP的比值作为估计效果。Pre-Period MSEP为政策前均方误差,Post-Period MSPE为政策后均方误差。如果Post-Period MSPE与Pre-Period MSEP的比值较大(比如说处于最大的5%的区间),则说明通过安慰剂检验。结果如图4所示,id=112城市的Post-Period MSPE与Pre-Period MSEP的比值在所有城市中排第一,所以通过了安慰剂检验。
[1]苏治,胡迪.通货膨胀目标制是否有效?——来自合成控制法的新证据[J].经济研究,2015,50(06):74-88.
图4 Post-PeriodMSPE与Pre-Period MSEP的比值
第三步 敏感性分析(迭代检验 stata命令在最下面)
参考宋等(2019)的方法通过迭代的方式做了如下的敏感性分析:以多次评估构建合成id=112城市的基础模型,每一次迭代过程中删去合成id=112城市权重比较大的一个县城,进行五次迭代,例如在一次合成中去除id=39的城市(表一id=39的城市合成比例最高),然后再进行合成控制法,再删除比例最大的城市,重复5次,绘制图5。结果如图5所示,5次敏感性分析的反事实都远低于实际情况下的结果,进一步表明政策促进了id=112城市的人均GDP的增加。
[1]宋妍,李振冉,张明.自然灾害对经济增长的长期间接影响——基于汶川地震灾区县级数据的合成控制法分析[J].中国人口·资源与环境,2019,29(09):117-126.
图5 敏感性分析