全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
3383 5
2012-06-01
    我是小菜鸟,我先来说说~{:2_28:}
    大家都知道,统计学是数据挖掘中一个很重要的基础学科,有时候我也迷迷糊糊不太说得清“数据分析”和“数据挖掘”这两个概念的本质区别,一直只知道数据挖掘是基于模型的。下面是从是否有前提假设的角度阐述了数据挖掘和统计方法的区别。
    通常的统计方法是在已有的假设基础上,从大量数据中得到验证,而数据挖掘则是从大量的数据中得到崭新的模式、结论和假设;数据挖掘是纯粹的给予数据驱动的方式,而统计方法则更多地引入人为因素并加以分析。探索式数据分析是统计方法中与数据挖掘最相似的分支,但它所面向的数据集还是比数据挖掘对象小很多。



     《谁说菜鸟不会数据分析》里面对数据分析和数据挖掘的关系是这样说的“数据挖掘其实是一种高级的数据分析方法。数据挖掘就是从大量的数据中挖掘出有用的信息,它是根据用户的特定要求,从浩如烟海的数据中找出所需的信息,以满足用户的特定需求。数据挖掘技术是人们长期对数据库技术进行研究和开发的结果。一般来说,数据挖掘主要侧重解决四类数据分析问题:分类、聚类、关联和预测。”
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-6-2 21:25:30
这话题有这么冷门么,555555555555555
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-6-8 22:41:35
其实我也想知道。。。。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-6-12 10:56:14
我觉得你写的已经很好了,已经掌握了精髓(除非你是抄的),根据我的个人理解,有三个要点:
1、统计往往是验证和定位,而数据挖掘是探索未知
2、统计方法的根本是“同类归并”,因此是不断丧失信息量的过程(因为已经有前提假设的模型,所以把模型中不必要的信息过滤掉也无不可);而数据挖掘方法是信息量无损的,建宽表本身只会增加信息量。
3、统计模型的验证用的是统计参数(所谓“有理”),而数据挖掘的验证根本的是商业实践(有用)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-6-13 13:26:41
whtclement 发表于 2012-6-12 10:56
我觉得你写的已经很好了,已经掌握了精髓(除非你是抄的),根据我的个人理解,有三个要点:
1、统计往往是 ...
“有理”和“有用”的评价很精辟~精彩哦~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-6-24 23:08:38
自己顶顶~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群