关联规则Apriori算法是数据挖掘中常用的一种算法。这里会涉及诸如支持度、最小支持阈值、置信度、提升值等概念。
1.假如有a、b、c、d四个分类,Apriori算法首先计算四个分类的在每个观察记录上的个数,然后两两组合再计算个数,小于某个数的删除,并计算置信度。以此类推。
2.设定最小置信度,并与上述置信度比较,小于最小置信度的删除。
3.最后计算提升值,大于1为正关联;小于1为负关联。
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝