使用政策出台时间点作为间断点(断点)进行精确断点回归(RDD)分析是完全可行的。在您的案例中,即研究2018年1月出台的政策对大气污染物排放量的影响,将2018年设定为断点是一个很自然的选择。
然而,在使用年份作为连续变量时,需要特别注意以下几点:
1. **线性与非线性关系**:在多项式拟合中出现奇怪的结果可能是因为数据中的非线性关系未被充分捕捉。您可以尝试增加多项式阶次或采用更灵活的函数形式来更好地拟合数据。
2. **核密度图异常**:如果您的核密度图显示异常,可能是数据分布问题或是选择的带宽不合适导致的。尝试调整带宽大小或者使用不同的核函数可能有助于解决这个问题。
3. **RDD适用性**:在决定采用RDD还是DID时,主要看的是政策实施是否接近于一个自然实验条件下的随机分配。如果政策是在某个特定时间点突然实施且对目标群体和非目标群体的划分较为清晰,则RDD可能是更合适的选择;而如果政策是逐渐实施或影响到所有个体但以不同方式或程度受到影响,则DID可能更为适用。
对于您的研究主题——分析一个具体年份出台的政策对大气污染物排放量的影响,如果满足以下条件:
- 政策在2018年前后存在明显且突然的变化。
- 可以找到一组“处理组”(受政策直接影响的城市)和一组合理的“控制组”(未直接受该政策影响或受影响较小的城市)。
那么使用RDD分析是比较合适的,因为它可以评估政策对处理组的局部因果效应。同时,如果您有理由认为政策的影响在不同的城市间存在差异性反应,并且这些差异与城市本身的某些特征相关联,则将DID模型与其他控制变量结合使用可能更全面地反映政策影响的不同维度。
最后,在实际操作中,确保断点附近数据的质量和可比性非常重要。如果处理组和控制组的选择、以及用于定义“接近断点”的标准不当,可能会导致偏误的估计结果。因此,在分析过程中应仔细检查这些假设,并尽可能通过敏感性分析来验证结果的稳健性。
希望这能帮助您更好地理解如何在您的研究中应用RDD方法!
此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用