全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
1770 2
2023-11-06
请问大家,我用的是1:1有放回卡尺匹配,结果显示只有21个观测值没有匹配成功,为什么_weight有这么多缺失值呢,keep  if _weight!=.后竟然删了12953个观测值。 微信图片_20231106101810.jpg 微信图片_20231106101823.jpg
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2023-11-11 23:35:54
没有任何问题,这个是数据本身就缺失,所以一定得给拿掉,缺少的原因就是由于实际调查,这项数值不好获得罢了,有的回答,有的没回答
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2024-11-23 16:38:10
在倾向得分匹配(PSM)中,_weight变量通常用于衡量匹配的质量和重要性。当您进行1:1的卡尺匹配时,理论上每对匹配应该产生一个非缺失的权重值。然而,在实际操作中,大量缺失的_weight可能由以下几个原因造成:

1. **匹配标准过于严格**:如果您的匹配条件(如卡尺宽度)设置得过窄或匹配过程中的某些额外约束太严格,可能会导致许多观测值找不到合适的配对伙伴。

2. **数据预处理问题**:在进行PSM之前的数据清洗和准备阶段可能存在错误。例如,如果在计算倾向得分时遗漏了重要的协变量或者对数据的分类不当,可能会影响到匹配结果。

3. **样本不均衡**:当治疗组与对照组之间存在显著差异,导致无法找到足够的相似观测值进行匹配时,也会产生大量的_weight缺失。

4. **软件或命令的具体实现细节**:不同的统计软件和命令在处理匹配过程中的遗漏、重复以及异常值的方式可能不同。某些情况下,即使匹配成功,也可能由于这些软件的内部逻辑而标记权重为缺失。

5. **有放回抽样问题**:尽管1:1有放回卡尺匹配允许一个观测值被多次用作匹配伙伴,但这并不意味着所有观测值都能找到匹配。特别是当治疗组和对照组在某些重要特征上的分布显著不同时,可能导致部分观测值找不到任何匹配。

解决这个问题的方法可能包括:

- **放宽匹配标准**:可以尝试增加卡尺宽度或者调整其他匹配参数,以提高配对的可能性。
  
- **重新审视数据预处理步骤**:确保所有用于计算倾向得分的变量都正确无误,并且没有遗漏重要的协变量。
  
- **使用不同的匹配方法或算法**:尝试使用其他的PSM策略或软件命令,看看是否能改善_weight缺失的情况。

- **增加样本量**:如果可能的话,收集更多数据可以减少因样本不均衡而导致的匹配问题。
  
- **检查并处理异常值和遗漏值**:在进行PSM之前,确保已经妥善处理了数据中的异常值、重复记录或遗漏信息。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群