全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1389 1
2012-10-25
最近我在处理一个很大的数据集,加了一条复合索引,由于同一条索引可能对应多个观测,所以我没有设置unique选项。每天我都用该索引更新数据。

现在问题来了,随着时间推移,索引文件变得越来越大。但是,当我删除该索引并重建后,索引又大大缩小。例如,原来的索引文件有1g,我先删除然后重新建个一模一样的索引,一般只有600m左右。

是什么原因导致了索引文件大小的不一致?看了下help,里面说索引文件包含了key值以及他对应的观测号。我猜测,是由于该索引非unique的原因,但具体机制还没搞明白。论坛的各位SAS高手请帮我解惑吧。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-11-2 14:38:30
index是大数据的产物 不好整啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群