在倾向得分匹配(Propensity Score Matching, PSM)方法中进行的平衡性检验,主要用于验证匹配后的处理组与对照组在协变量上的可比性。这有助于确保任何观察到的效果主要归因于处理效应,而不是其他混杂因素。
### 平衡性检验的标准:
1. **标准化均值差**:一个常见的标准是检查处理组和对照组之间协变量的标准化均值差异是否小于0.1(或更严格地来说,0.05)。这个指标反映了两个组在每个协变量上的均值差异相对于该变量标准差的比例。越接近于零表示平衡性越好。
2. **卡方检验或t检验**:对于分类变量,可以进行卡方检验;对于连续变量,则可使用t检验来比较匹配后的两组间是否有显著的统计学差异。通常情况下,如果p值大于0.05(或你选择的其他阈值),则认为该变量在两组之间是平衡的。
3. **可视化检查**:通过密度图、箱线图或直方图来直观地比较处理组和对照组中协变量的分布。理想情况下,匹配后两个组应显示出相似的数据点分布模式。
4. **总体效应量(Effect Size)的变化**:在进行PSM前后的效应量比较也很重要。如果PSM明显减小了估计的标准误差且未显著改变效应的方向或大小,则可以认为平衡性检验通过。
### 判断是否“通过”:
如果你的分析显示大多数(如果不是全部的话)协变量在标准化均值差、卡方检验或t检验方面都符合上述标准,那么可以说匹配后的样本实现了很好的平衡。然而,在实际应用中,完全达到所有理想条件可能很难,因此需要根据具体情况和研究目的来综合判断是否接受结果。
### 实践建议:
- 在PSM过程中,使用多种匹配方法(如最近邻匹配、卡尺匹配等)并比较不同方法下的平衡性检验结果。
- 考虑使用熵平衡或其他高级匹配技术,以提高协变量之间的平衡度。
综上所述,通过综合评估标准化均值差、统计学检验和可视化结果来判断PSM后数据的平衡性。如果这些指标表明两组之间在所有或绝大多数协变量上的差异不大于预设标准,则可以认为平衡性检验“通过”。
此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用