全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
2015-2-7 23:41:00
bhfly 发表于 2015-2-7 23:31
嗯。我试的时候有加,可是还是跑了19个小时。是因为一开始没有排序的原因吗?
刚看到那个程序有distinct限制,应该没有重复。但是distinct可能慢。试试去掉distinct,加上限制条件,看看时间
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-8 00:16:13
bhfly 发表于 2015-2-7 23:01
呵呵。。。跑了19个小时!!!
真有耐心,
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-8 14:12:48
看了一下数据,终于知道为什么mingfei的几十秒能算出来,别的程序要19个小时了。
1万多行的数据,不知道为什么读进来100万行。
所以在处理之前,要进行数据探索,首先就是看missing和duplicated,不要进行无谓的错误的计算。
第二要心里有素组合之后会有多少组合出现。最多的一个是indyear=232011, 有792种code,会产生792×792/2种组合。最少的有20种,会产生200种组合。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-8 21:42:06
bhfly 发表于 2015-2-6 17:47
这个方法看不懂。。。能再详细一点吗?
对不起。你面对的真的是一只很菜的菜鸟。。。
看一些中间数据集的内容不久清楚了,前提是你要对format有所了解
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-8 21:46:27
teqel 发表于 2015-2-7 23:23
这个程序不错,就是有重复,要加一个限制条件a.code
有distinct还会有重复?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-9 09:10:05
wpfwxn 发表于 2015-2-8 21:46
有distinct还会有重复?
是我看错了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群