温故知新,忽然想到,是的,没暴露出的那部分可能是更要命的。通过一些方法,真实的统计数据也可以拿来骗人。例如,平均数有多种形式,众数、中位数、均值等,注意它们的适用范围,并谨防它们被不轨者非法利用进行欺骗。均值很不具有稳健性,它太容易受到异常值的影响。在描述大样本的平均水平时,不妨多考虑一下中位数。
对统计资料应该质疑,不要盲目的相信,注意以下几个问题:1.谁说的?2.他是如何知道的?3.遗漏了什么?(往往是有意的遗漏某些重要方面。)4.是否有人偷换了概念?5.这个资料有意义吗?
对此感兴趣的同学,可以看看《统计数字会撒谎》(How to lie with statistics
,真实数据后面的谎言,畅销美国50年的投资经典)、《女士品茶——20世纪统计怎样变革了科学》等翻译过来的书籍(后面这本论坛里有下载)。