不论是传统的统计分析也好,还是现在热炒的大数据也好,都是为实现某些确切的目标服务的。只不过对于前者,分析人员先有一个明确目标(例如,统计学教材里面的经典案例——收入与销量的关系),然后再去收集收据,这样收集的数据就必然在某些属性上具有局限性(收目标约束);而对于后者,人们是已经拥有了海量数据,然后产生想有效利用这些数据的想法,在一个相对模糊的目标下,通过“数据挖掘”的方式,获得一些结论(例如,尿布与啤酒)。还有前面一个同学也讲了,大数据之所以近几年兴起,是互联网技术发展的必然,有了海量数据存储技术、有了复杂数据分析技术,当然最基本的是全球几十亿网民(消费者经意意不经意间通过各种途径留下的信息(也就是所谓的大数据),这在以前是不可想象的。大数据再大也不是全部,大数据分析技术归根结底还是对有限数据进行处理,得出某些在统计上可信的结论(不等同于事实),因此,大数据分析仍然是统计分析学的一部分。至于某专家所说,统计学就是通过少量样本推断出总体的某些特征,这是传统统计学的定义,统计学也在发展,统计这个词的含义当然也需要与时俱进。