在描述有关关联规则的一些细节之前,我们先来看一个有趣的故事: "尿布与啤酒"的故事。
在一家超市里,有一个有趣的现象:尿布和啤酒赫然摆在一起出售。但是这个奇怪的举措却使尿布和
按常规思维,尿布与啤酒风马牛不相及,若不是借助数据挖掘技术对大量交易数据进行挖掘分析,沃尔玛是不可能发现数据内在这一有价值的规律的。
数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联。关联分析的目的是找出数据库中隐藏的关联网。有时并不知道数据库中数据的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度。关联规则挖掘发现大量数据中项集之间有趣的关联或相关联系。Agrawal等于1993年首先提出了挖掘顾客交易数据库中项集间的关联规则问题,以后诸多的研究人员对关联规则的挖掘问题进行了大量的研究。他们的工作包括对原有的算法进行优化,如引入随机采样、并行的思想等,以提高算法挖掘规则的效率;对关联规则的应用进行推广。关联规则挖掘在数据挖掘中是一个重要的课题,最近几年已被业界所广泛研究。
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
littledog.. 发表于 2014-12-10 11:31 啤酒和尿布的故事我听过 哈哈
Mirror.. 发表于 2014-12-10 12:02 你的看到其中的深奥
littledog.. 发表于 2014-12-10 14:08 其中的深奥就是数据关联啊 因为买尿布的大部分是孩子的爸爸,所以他们会顺手给自己买啤酒。那么把着两 ...
Mirror.. 发表于 2014-12-10 14:16 恩 还不错 看来还是认真看了