统计学上的显著性差异和实际差异容易被混淆。在我看来“显著性”这个统计术语是被滥用了。当样本符合假设前提时,it's ok. 但很多时候这些前提并非严格符合,而是我们的假设。例如我们比较北京和南京的学生身高差异,选取随机样本做一个两样本t检验,其中样本正态的前提通常只是假设的,在样本量较少的情况下,我们很有可能会得到两地学生身高是有显著性差异的。 但问题是我们无法确定到底多大的样本量才足够精确,因此统计学上的显著性差异应该表示样本量足够多可以清晰地反应出差异性,非显著性则应表示样本量不足以反映实际的差异。不过很多时候“显著性"这三个字太过诱人,容易让人做出错误的决定。