1. 变量 `_weight` 确实表示一个观测值在匹配过程中的“权重”,即它被匹配了多少次。如果 `_weight` 为缺失值(.),这可能意味着该观测值没有找到匹配项或者匹配过程中出现了问题。即使该观测值显示为 "On support",也有可能是因为匹配算法虽然考虑了这个观测值,但最终并未给它分配一个匹配伙伴。
2. 在使用 `expand _weight` 命令之前,通常建议先处理缺失值。你可以根据研究需求选择以下两种策略之一:
- 删除 `_weight` 为缺失值的观测值,因为它们没有有效的匹配。这样可以确保所有保留下来的观测都有明确的权重。
- 如果担心删除这些观测会导致样本损失过大,你可以考虑用其他方式填补 `_weight` 的缺失值(例如使用平均权重或其他合适的方法),然后再执行 `expand _weight`。
另外,确定处理组和控制组时,一般只需保留 `_support=On support` 的观测值。这是因为 `_support=On support` 表示这些观测值在匹配后被保留下来,并且有相应的匹配对象。删除 `_support=Off support` 的观测值可以保证你的样本仅包含成功匹配的对。
最后,使用 DID(差异-in-differences)分析时,请确保你理解其假设并检查匹配的质量,以确保结果的有效性。祝你研究顺利!
此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用