最近听同学说到一个问题:如果假设检验后,发现两个样本所代表的总体率有差异,这两个率能直接比较吗?还是要做先做率的标化再比较?有人回答,如果能保证样本能代表总体,并且两个总体构成相似,就可以用计算得到的率直接比较差异,否则要做率的标准化。
问题就来了,我们抽样抽的都是有代表性的样本,且两组或多组都是用混杂因素匹配过得,既然是这样,假设检验有统计学意义,两组不是就可以直接比较大小了吗?为何还要作率的标准化?
然后又有人回答:你怎样证明你的样本有代表性?再说两个总体构成不见得就一致,不一致的话抽到的样要代表总体,得到的样本要具有代表性,那两个样本构成很可能就不一致。所以,最好的就是对有统计意义的结果做标准化后再比较大小。比如:随机对照的临床试验RCT是实验研究的金标准,但最近有人提出就算抽样是完全随机的,实际也不一定就是完全代表总体,实验组和对照组其他的非研究因素也不一定就控制的很适当,我们只是尽量做到随机化、对照、盲法等,而且研究也要符合现实实际的真实性,所以最好就是标准化再比较更好一点……或者用分层的方法可以直接比较大小,不需要做标准化。
如何证明所抽样本具有代表性?或者说如何在抽样的过程中能保证抽到的样本具有代表性?有统计学意义的差异比较是否需要做率的标准化?