以前也曾想过这个问题,看了一些书,也不自量力的总结一下数据挖掘与统计学之间的关系。。。
我是觉得,数据挖掘与统计学的区别在于,首先从目的而言,数据挖掘的目的是发现知识,可以说是一种“发现驱动”的分析方法。而统计学的一些方法,更多的是为了验证一些假设,可以说是一种“假设驱动”的分析手段。
然后从他们所用的数据来源、需求和数据的性质来看,因为数据挖掘的目的是发现知识,或者说挖掘数据背后隐藏的信息,那么首先就需要海量的数据为前提,另一方面他需要的数据大多数并不是通过问卷这些手段主动收集得到的,而通常是抓取一些数据库中记录的基本信息和用户的行为数据,我个人觉得这部分数据的客观性较高,但分析难度也相应的较大。而统计分析的数据来源大多是发放设计好的问卷来收集,因为问卷的设计也是假设的一种体现,所以数据之间本身就存在了更严密的逻辑性,因而统计分析的数据量需要相比数据挖掘会小得多,数据分析的工作设计也不会有数据挖掘一样的复杂。而从问卷的问项本身来说,针对的是一些基于行为的态度和认知,个人觉得数据的主观性会相对强一些。。。。
恩。。。可能只是个人的一些看法,希望这里的高人们指正。。。