https://bbs.pinggu.org/thread-2139135-1-1.html
出发点很好,大数据下的统计方法的发展,可是读完后,发现就是玩技巧,没有一点思想的内容。
还记得当时做microarray data的时候,和一个师兄争论,小概率事件在大样本下一定会发生,后来到支付宝从数据中证实了我的观点,在近几亿的用户,什么事情都有可能发生。而看这本书,没有从思想上进行,而是技巧上,最有意思的是从家庭收入到GDP,只可惜还是太粗了。
大数据下的统计基础,应该由经典统计中正态分布变为levy分布,这是我看大数据的感觉,也是今后的一个潜在方向。