昨日阅读1小时,累计阅读218小时
辛普森悖,当你把数据拆开细看的时候,细节和整体趋势完全不同的现象。
从统计学家的观点来看,出现辛普森悖论的原因是因为这些数据中潜藏着一个魔鬼——潜在变量(lurking variable)
我们要怎样才能避免辛普森悖论呢?
答案是…很难。不少统计学家认为,辛普森悖论的存在,让我们不可能光用统计数字来推导准确的因果关系。
因为数据可以用各种各样的方式分类,然后再进行比较,所以理论上潜在变量无穷无尽,你总是可以用某个潜在变量得到某种结论。
而且对于那些不怀好意的人来说,他们很容易对数据进行拆分或者归总,得到一个对自己有利的指标,从而来迷惑甚至操纵他人。医学和社会学的研究者也常常会遇到辛普森悖论,从而得出错误的结论。