多级空间关联规则挖掘及性能评价方法
数据挖掘就是在现有的技术条件下,从大量的、不完全的、含有随机性的数据集中,挖掘其中隐含的并且具有重要价值的知识过程。但是随着现代社会的知识的飞速产生及发展,
数据挖掘技术变得越来越重要。
本文在Apriori算法的基础上,结合堆排序和链表的优点,设计了一种改进的Apriori算法,并将其应用到多级空间关联规则的挖掘中,并对评价方法进行了相应的研究。关联规则是数据挖掘中最常使用的方法,只有发现关联规则才能够挖掘数据集中存在的数据关系。
本文设计了一种新的发现关联规则的方法。该方法结合了Apriori算法和堆排序的特点。
通过对实验结果的分析,发现改进后的算法是有效的,并且得到的结果是频率最高的前n项,即重要关联规则。改进后的算法不仅优化了数据集的选择和生成候选集的运算,也优化了剪枝的过程。
另外本文的算法在一定程度上可以利用已有的挖掘结果,将现有的结果和未来新产生的数据集相结合,能较好的发现重要规则并利用其价值推断相应的规律。最后将本文改进的算法应用到多级空间关联规则挖掘过程中,并对实验结果进行了分析。
关联规则的评价方法主要是为了对关联规则算法进行多方 ...