lizhewenbei 发表于 2015-4-7 08:56 
这样样本缩减很多啊,很可能是:处理组2000,对照组2000。另外我发现,很多对照组都是处理组同一家公司的 ...
第一,样本缩减远比控制组和处理组样本差异大问题来的严重(直接影响到因果识别)
第二,对照组和处理组是同一家公司不同时期的问题确实存在,我当初做PSM时就遇到过这样的问题,后来好像解决了。思路大概是先对对处理组和待匹配组的ID做一个识别,即先明确那些是处理组,保证处理组样本不能进入匹配组。然后再进行匹配。你好好琢磨肯定能找到思路的
