fupingzlg 发表于 2020-3-25 17:48 
请问,为什么把解释变量打乱就可以排除时间趋势呢?如果显著了说明什么,不显著又说明什么呢?
主要是检验期望形式的内生性条件。
当我们知道$\mathbb{E}[D \cdot \epsilon |X] = 0$的时候,才不会有内生性(也可套到selection bias,结果是差不多,但一般更频用倒数第二个形式来表示)的。而在Rubin因果推断框架下,我们是将下面定义为因果效应:
$ATE := \mathbb{E}[Y^1 - Y^0 | X] $
在没有selection bias(国内很多人分不清selection bias和内生性,尽管结果都造成处理变量和误差项不正交)的时候,我们可以进一步得到:
$ATE := \mathbb{E}[Y^1|D=1, X] - \mathbb{E}[Y^0|D=1, X] $
而安慰剂就是检验,控制同一套控制变量 $X$ 的情况下,如果随机生成一个 falsified 的处理变量$D^{fal}$(或核心解释变量)时的结果,是不是仍然显著。其期望形式就是:
$Bias = \mathbb{E}[Y^1 | D^{fal} = 1, X] - \mathbb{E}[Y^0 | D^{fal} = 0, X] =^? 0$
当然,如果只是一次,会有点武断,别人会怀疑是cherry picking?(除非挑的这一次,是有具体经济含义的)。所以,一般要重复N多次(一般至少500,甚至1000次)。如果是很多次的话,它就会变成类似迭代期望的形式,即
$\mathbb{E} [Bias] = \mathbb{E}[\mathbb{E}[Y^1 | D = 1, X] - \mathbb{E}[Y^0 | D = 0, X] ] =^? 0$
如果不显著,就说明这个bias的期望为0。主要解读为,不存在不可观测的某一趋势导Y会独立于D的变化。而导致它不满足的来源就是,有什么不可观测的latent variable(s)没有控制好,从而导致识别策略
invalid。具体,可以参考Chetty, Friedman and Rockoff(2014),这里摘一句:
In general, a placebo test requires that there is no channel through which the treatment variable might covary with the placebo outcomes when the research design is valid.