全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
5427 8
2012-08-28
各位大侠:
我用clemetine12跑apriori,数据表示一个10K条,137列的事务表,典型的关联规则问题,
已经跑了1个多小时了,还50%,问问有什么办法能提高计算效率吗?

之前跑了一晚上,数据量更大的,但是阈值太高,没结果,我筛选了数据才减少到这个量级的。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-8-30 17:59:55
自己答,clementine还是不行,两条路:加强计算能力,缩减数据。
砖家建议用R,吾等傻瓜不喜编程。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-4-25 10:32:50
顶楼主事后解答
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-4-25 13:38:02
bayannur 发表于 2013-4-25 10:32
顶楼主事后解答
哈哈 我在人大论坛经常干这样的事儿!
再补一点点说法,这个后来在SAS-EM环境下实现了,但是SAS单机的处理能力也是有瓶颈的,更大的数据量可以考虑分布式计算环境,mapreduce或者R之类的,我正打算尝试。不过这就不是SPSS的范畴了。真要做大数据的挖掘,早日抛弃SPSS吧
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-4-25 14:14:18
complicated 发表于 2013-4-25 13:38
哈哈 我在人大论坛经常干这样的事儿!
再补一点点说法,这个后来在SAS-EM环境下实现了,但是SAS单机的处 ...
很多人说大数据量得用sas。我目前处理的数据一般用spss已经足够了。。。。
顺便一个问题,如果知道给指点指点呗
我编了一个spss的程序,存为.sps文件。我怎么在windows的dos命令行下调用呢。因为我想做成定时任务每天执行
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-4-25 16:10:49
bayannur 发表于 2013-4-25 14:14
很多人说大数据量得用sas。我目前处理的数据一般用spss已经足够了。。。。
顺便一个问题,如果知道给指点 ...
合适自己的就是最好的,
你说这没搞过,不过大概好像是写一个批处理程序,调用你的.sps脚本之类的。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群