全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
3538 3
2018-01-02
之前处理过千万条数据,SAS在处理一些基本运算如加总、笔数时已经不太行了,等上好几个小时是常见的事,伺服器版本的EG在静止状态过久时会断线,SAS在处理巨量上简直是悲剧。目前我遇到你上亿等级的数据,有啥好方法可以提速吗?还是放弃SAS改用其他软件?


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-1-2 14:04:54
https://mp.weixin.qq.com/s/UcnZ2Utob6sO-I9YYfqo2g
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-1-2 16:57:55
l1i2n3i4n5g 发表于 2018-1-2 14:04
https://mp.weixin.qq.com/s/UcnZ2Utob6sO-I9YYfqo2g
非常好的分享,学习了。膜拜大侠。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-1-13 21:59:48
可以并行处理。主要用data步把数据拆分成几个相对较小的;然后基于每个拆分的数据集进行分别处理,生成各自的代码,保存为SAS代码文件;然后再生成SAS代码的批处理文件,便于直接调用运行;利用systask command语句调用上面的N个处理文件执行代码;然后用waitfor语句等待批处理完成,最后将各批处理结果合并即可。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群