谈一点自己的看法.
在统计分析中,含差别分析(均数比较)和联系的分析(相关分析), 在设计阶段,都需要估计样本含量,然后收集数据,再进行分析. 而不是拿到数据后, 再看样本含量是否足够. 样本含量的估计与一类错误,二类错误有关, 同时也与研究指标的误差有关. 比如, 社会经济学的指标,人的行为态度指标,误差较大,要探讨他们间的差别或联系需要较大的样本. 相反,如分子生物学的指标,生物化学的指标等比较精确, 较小的样本含量也可以探讨出事物之间的区别和联系.
同意以上朋友的观点, 样本含量与设计也有很大关系,如单因素的方差分析与正交设计,同一个指标,其样本含量则相差几十倍. 对回归分析,一型回归和二型回归样本含量的估计也不同. 多元回归和单因素回归样本的要求也截然不同. 因此, 样本含量不是大于30和小于30的问题. 而要根据研究的问题定. 因此,8个样本含量,对有些研究是足够的, 如化学,生物化学的标准回归直线就是6-8个测试点, 若是分子生物学的研究,8个测试点可能相当昂贵.
另外, 样本含量大可能容易得到阳性结果,但这个联系可能是虚假的. 另外,大样本不仅浪费, 也可能造成较大的误差.
感兴趣的同学可以访问以下免费网站, 估计样本含量.
http://www.danielsoper.com/statcalc/calc01.aspx
http://www.epibiostat.ucsf.edu/biostat/sampsize.html