蓝色 发表于 2019-10-5 09:10 
自己收集的数据一般都是按照一定规则排序的。如微观数据,一般按照省市县乡村户个体排序的,不是随机打乱 ...
让我举个例来说明,假涉有一治疗观察值 T1 之倾向得分为 0.8,而我们找到对应之控制组有三个观察值 C1, C2, C3 (假设其倾向得分也都为 0.8),类似
最后一列假设是某一变量 x 之值。
若一开始,从母体随机抽样之顺序就是 C1, C2, C3,但如同您所谈的---可能经过个人排序---变成顺序为 C2, C1, C3 (若不 sorting,就选 C2)。现在也如同您之建议,要做 random sorting,变成 (假设为) 顺序 C3, C2, C1 (此时选 C3)。这三个 C1, C2, C3 都是母体随机抽取出来刚好可以与治疗处之 T1 配对的,我就无法理解,为何选择 C3 (或其他随机 sorting 情况,可能是 C1) 就比 C2 好? 还是"不小心" 选到 C2 还要重 sorting?