数据挖掘是做什么的
数据挖掘(Data Mining)的定义是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。数据挖掘能做以下七种不同事情:· 分类 (Classification)· 估计(Estimation)· 预测(Prediction)· 相关性分组或关联规则(Affinity groupingor association rules)· 聚类(Clustering)· 描述和可视化(Description and Visualization)· 复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等)。
数据挖掘是最近几年才开始在国内兴起,并且进入企业应用。网站的智能化和个性化,也需要这样的技术来支持。其中,数据挖掘的算法很多来自机器学习和人工智能技术。
我想说的是,大家也来举例说明,数据挖掘带给我们什么。
我来说一个。比如在豆瓣里面,关于书的推荐问题,关键词或者tag的相似度计算,比如有人买了数据挖掘,还要买茶方面的书,这2个关键词是不同的,从分类角度说是么有联系的,但是从数据挖掘的角度来讲,用户的习惯如此。