悬赏 20 个论坛币 未解决
最近正在做一个DiD分析,但是处理组和控制组之间对称性不好,因此采用PSM寻找合适的控制组。
我采用的是“有放回1:3最近邻半径匹配”,这样匹配出来结果中每个处理组企业就有3个对应的控制组企业。比如我有100个处理组企业,匹配出来就应该有300个控制组企业,但是由于是有放回的,所有有的控制企业被使用了多次,导致控制组企业实际是小于300个的(比如只有220个不重复的控制组企业)。
现在问题来了:我在做后续DiD分析的时候,回归时样本数量应该是100(处理组)+300(包含权重的控制组),N=400,还是100(处理组)+220(不考虑权重的控制组),N=320?
望熟悉的小伙伴指点一下,非常感谢~~