全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1468 2
2015-04-17
我在实际工作中遇到个问题,因为数据集比较大,有近2千万条数据,为了查询速度,我建议了符合索引(3个变量),查询速度是快了很多,但是我需要定期对该数据集进行更新,采用的方法是通过merge(因为某些原因,modify和update都不适合),但是merge的前提是数据集要先按照by 变量先排序,我看了SAS的书上好像都说数据集建立索引之后就不能排序,我操作的时候系统确实提示了如要排序必须用force参数强制排序,不知道用强制排序是否有影响,不然应该怎么办?是否先删掉索引,待排序更新后重新建立索引?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-4-17 21:48:49
自己顶一下...
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-4-17 22:42:46
wxmouse 发表于 2015-4-17 14:20
我在实际工作中遇到个问题,因为数据集比较大,有近2千万条数据,为了查询速度,我建议了符合索引(3个变量) ...
by数据项可以用notsorted选项吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群