全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
3103 8
2012-10-19
和各位大牛讨论一个问题:
我在做文本挖掘,每次提取一段时间的搜索日志,数据清洗之后,用apriori算法,会得到如“联想-华为”,“腾讯-百度”这样的规则。
每个规则都有相关指标如Lift,Support,Confidence,Transaction Count。
我想给这些规则打一个分数R,用来做排序,比如如果R(联想-华为)>R(联想-神州数码),那么我就认为“联想-华为”这条规则更重要。
这个分数是用上述哪个指标,或者哪些指标折算来比较合理呢?
我现在倾向于使用transcation count/sample size,因为这样来的最直接,不知还有更合适的吗?
望不吝赐教!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-10-24 15:40:11
没人理,我悬赏还不行么?怎么设置悬赏啊?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-10-24 15:41:21
好吧  支持你一下。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-10-31 16:10:26
谢谢分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-11-2 10:46:55
。。。。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-11-8 18:37:46
在一般情况下利用lift规则的提升度来进行衡量吧!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群