在倾向性评分匹配中确定协变量的方法通常遵循以下步骤:
1. **识别混杂因素**:首先,你需要识别与暴露(实验组和对照组)和结局变量都相关的所有潜在混杂因素。这些通常包括人口统计学变量、健康状况、行为习惯等。
2. **选择协变量**:你提到有9个社会人口学变量,理论上来说,纳入所有这些变量作为协变量可以帮助消除它们对结局变量的影响。然而,如果某些变量高度相关(如年龄和工作年限),只选择一个代表性的变量可能更合适,以避免多重共线性问题。在这种情况下,你可以根据研究背景和领域知识决定保留哪一个。
3. **建立倾向性得分模型**:使用二元logistic回归或其他合适的模型,将暴露作为因变量,协变量(包括社会人口学变量)作为自变量来估计每个观察值的倾向性评分。如果工作年限与年龄高度相关,可以选择一个更能反映研究问题的变量,如工作年限,并以连续形式纳入模型。
4. **匹配和评估**:根据倾向性评分进行匹配,可以使用最邻近匹配、分层匹配或非平衡回归等方法。匹配后,检查匹配效果,看是否所有混杂因素都达到均衡。如果仍有未均衡的混杂因素,可以尝试其他匹配策略,如按该变量分层。
5. **分析结果**:在匹配后进行分析时,倾向性评分可以作为协变量纳入到结局模型中(例如线性回归或逻辑回归),以进一步控制匹配后的剩余偏倚。你提到的PS得分是基于3次匹配汇总得到的,这可能是可行的,但要确保每次匹配都考虑了相同的混杂因素。
最后,建议你在进行分析时与统计顾问合作,确保你的方法正确且符合研究目的。祝你的学位论文进展顺利!
此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用