在这一期里,我们尝试对DID模型估计的另外一个检验—安慰剂检验的绘图做一些分享。安慰剂检验最早来源于医学研究。根据百度百科的介绍,安慰剂效应又被称为伪药效应、假药效应、代设剂效应,指病人虽然获得无效的治疗,但却“预料”或“相信”治疗有效,而让病患症状得到舒缓的现象。在我们常用的DID模型估计中,为了排除处理组(treatment group)和控制组(control group)的趋势差异并非是由除接受政策处理之外的随机性因素导致的,通常会通过随机改变政策处理时间(In-time placebo test)、随机改变政策处理对象(In-space placebo test)、同时随机改变政策处理时间和政策处理对象(Mixed placebo test)来进行相应的安慰剂检验。关于上述三种安慰剂检验的基本实操,我们就不在这里班门弄斧了,网络上关于这方面的推介实在是汗牛充栋,大家可以移步慢慢细品!
值得注意的是,在进行后两种安慰剂检验(In-space placebo test和Mixed placebo test)时,我们通常会得到相应的500次或者1000次抽样回归的估计系数值、标准差和p-value。在论文写作和汇报时,比较常用的一种方式是绘制相应的安慰剂检验图。但是,从现有大多数论文的呈现结果来看,利用Stata软件绘制的安慰剂检验图和平行趋势检验图一样稍显有些“质朴”,大致是这个样子
又或是进行了一些修饰,像这样
不得不说,这样的图示,确实不影响对安慰剂检验结果的基本分析,但总感觉还是有那么一点点“普”,或许我们可以尝试做一些改造。
0 平行趋势检验原始出图
在进行安慰剂检验时,其实可以基于得到的500次或1000次回归的系数来绘制直方图,然后再添加相应的核密度曲线,最后将基准回归的DID估计值标记在整个图层上。按照这样的一种思路,我们首先还是尝试利用MATLAB软件做一下原始出图。
可以看出,在不加任何修饰的情况下,利用MATLAB软件做出来的安慰剂检验图同样非常粗糙。接下来,我们首先从线条对象、坐标轴对象和图例对象等基本元素对原始出图进行逐步改造。
1 基本作图元素修改
和原始出图对比,图(a)中的许多细节都做了明显的改动。与前期的DID色系保持一致,我们主要采用了绿色、棕色和红色三种配色。可以清楚地看到,基准模型的DID估计结果(0.0244)位于整个“伪”DID分布的右尾部分,说明基准DID估计值要异(大)于绝大多数“伪”DID估计值,因此基本上可以排除其他随机因素的干扰。但是在这张图里,我们无法一目获悉基准模型的DID估计值以及对应的显著性水平。
2 去网格化和去边框化
按照惯例,我们继续改造,首先可以将不必要的网格线和框线剔除以保证整个图框的背景比较简洁。同时,我们尝试把基准模型的DID估计值以及对应的显著性水平标记标记在整个图框上。
3 ggplot和seaborn风格
这两天发现后台私信的小伙伴们还是非常喜欢ggplot和seaborn风格化的图式,可能它既简约而又不优雅。同样的,这里我们也尝试将这种风格应用到安慰剂检验图的绘制中。
4 更多色系搭配
高饱和度的棕-绿-红的配色搭配看多了可能容易审美疲劳,这里我们提供另外三种配色供小伙伴们参考。第一种是偏低饱和度的棕-绿-橙
第二种是咖色系
第三种是偏高饱和度的红-蓝-黑
5 左右开弓
我们也可以将500次或1000次“伪”DID估计系数对应的P-value绘制在图层上。但是需要注意的是,P-value值都是位于0和1之间,因此数量级要小于估计系数的频率分布图。如果强行让它们共用一根纵轴(Yaxis)的刻度值可能会极度不和谐。为了改进这一点,我们尝试“左右开弓”,将估计系数的频率分布图和核密度曲线图绘制在左边的纵轴上(Left-Yaxis),将P-value值绘制在右边的纵轴上(Right-Yaxis)
这张图上的元素稍显得有点多,包含了频率直方图、曲线图和散点图,配色也是达到了四种,同时我们在图例里标记了相应的Left-Yaxis和Right-Yaxis,并且将它的位置放在整个图层的外下方,因此整个图形显得有点扁。从简洁化的角度来看,个人不建议大家使用过于复杂的图形,因为总显得不那么直观。
至此,DID系列的安慰剂检验作图分享就暂时告一段落了,欢迎小伙伴留言讨论你最喜欢什么样的安慰剂检验图示。科研合作方面需要作图支持和帮助(免费无偿)的小伙伴请在后台私信。
在下一期里我们继续对DID模型的另一个常用稳健性检验—倾向得分匹配相关的作图(匹配前后的变量平衡性图、核密度分布图等)做一个重点分享。