经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
计量经济学与统计论坛 五区
›
计量经济学与统计软件
›
Stata专版
倾向得分匹配(PSM)参与匹配的样本太少、pscore分布不均匀怎么解决?
楼主
SU==
4869
1
收藏
2023-04-03
请教大家,
我正在做倾向得分匹配(PSM),匹配之后发现(1) _pscore 分布很不均匀,几乎都分布在 1 附近;(2)_weight 中没有参与匹配的太多太多,一共 3546 个样本,损失了
2249 个
。
想问下大家,这个样本损失量是可以接受的吗?
我想找到问题变量,剔除部分样本再去做,不知道可不可以?
以及怎么迅速找到呢?
谢谢大家!
复制代码
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
lalala是我的
2023-4-20 10:09:58
关于第一个问题,_pscore 分布不均匀的原因可能是匹配变量本身的分布不均匀,导致某些变量的权重较高,进而对 _pscore 的分布产生影响。你可以检查一下匹配变量的分布情况,看是否存在较大的偏离。另外,PSM 本身并不能保证得到的匹配样本的分布具有很好的平衡性,因此可以尝试使用倾向得分子集匹配 (PSM with propensity score subclassification) 或者 基于重要性重采样的匹配 (matching with important sampling) 模型,进一步提升结果的平衡性。
关于第二个问题,如果 _weight 中没有参与匹配的样本很多,可能是由于选择的匹配变量不足或者不够精准导致匹配难度较大。如果想找到问题变量,可以尝试通过观察变量在匹配前后的差异来判断其对匹配效果的影响大小。可以使用群组 t 检验或者 Wilcoxon 等非参数检验方法来比较不同变量在匹配前后的分布差异,进而筛选取决于匹配效果的变量。
最后,关于如何迅速找到问题变量,尝试以下方法:
1. 观察匹配前后变量的分布差异。可以通过 Summary Statistics 等工具来查看各个变量在匹配前后的分布变化情况。
2. 调整匹配模型的参数。可以通过调整匹配模型的参数来提高匹配的精度。比如增加匹配变量、调整匹配变量的权重等。
3. 对变量进行分组。将变量在匹配前后的分布进行分组,然后比对组间的差异,来快速定位问题变量。
4. 使用树形结构模型等决策树模型来筛选重要的变量,进而进行变量选择。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
倾向得分匹配具体操作过程
倾向得分匹配
倾向得分匹配(PSM)求助
倾向得分匹配(PSM)求助
广义倾向得分匹配结果不显著
倾向得分匹配
倾向得分匹配中无混淆性怎么理解?
倾向得分匹配
倾向得分匹配PSM案例分析
倾向得分匹配后T值变大
栏目导航
Stata专版
灌水吧
经管文库(原现金交易版)
新手入门区
市场行情分析
行业分析报告
热门文章
新宏观丨扩大内需的最大障碍是什么?
现代数学译丛14非线性最优化基础
【浙商证券】太空算力与商业航天行业专题报 ...
2026年技术趋势报告 Tech Trends 2026-德勤 ...
现代数学译丛10 调和分析基础教程
民营企业涉税合规自查手册
【华西证券】AI浪潮之基,电力价值与生态重 ...
物流运作基础 (英国皇家采购与供应学会(CI ...
【顶刊方法,24重磅!】2005-2024上市公司绿色 ...
2026年Stata初高级寒假班—AI赋能+原理+操作 ...
推荐文章
26年寒假天津站|Gemini论文写作&数据分析 ...
2026JG学术冬训营:从Stata初高到Python机器 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
几种免费下载文献的方法----我的文献应助经
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群