在倾向得分匹配(PSM)中,核匹配、最近邻匹配和半径匹配是三种常见的匹配策略。它们的主要区别在于如何选择控制组的样本与处理组样本进行匹配。
1. **最近邻匹配**:
   - 这是最直观的一种方法,它基于每个处理组单位找到一个或多个最接近的控制组单位。这种“最接近”通常是通过计算两个单位在倾向得分上的距离来确定。
   - 优势:简单直观,易于理解和实施;可以有效减少模型依赖性。
2. **半径匹配**:
   - 它不是寻找最近邻,而是为每个处理组单位找到所有在其给定的“半径”内的控制组样本。这里的“半径”是指在倾向得分尺度上的一个固定阈值。
   - 优势:可以捕捉到多个控制组单位对处理组的影响,从而可能提供更稳定的估计;避免了最近邻匹配中因为个别极端点导致的结果偏差。
3. **核匹配**:
   - 核匹配是一种加权平均方法。它为每个处理组单位在控制组中找到的邻居赋予不同的权重,这个权重由这些邻居与该处理组单位的倾向得分之间的距离决定。
   - 优势:可以更精确地反映控制组样本对结果的影响;通过核函数的选择(如高斯、Epanechnikov等),可以在一定程度上平衡偏差和方差。
每种匹配策略都有其优劣,选择哪种取决于研究的具体情况,比如样本分布的特性、潜在的处理效应形式以及数据的质量。在实际应用中,为了提高估计精度和稳健性,通常会尝试多种方法并比较结果。
此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用