最近我在处理一个很大的数据集,加了一条复合索引,由于同一条索引可能对应多个观测,所以我没有设置unique选项。
每天我都用该索引更新数据。
现在问题来了,随着时间推移,索引文件变得越来越大。但是,当我删除该索引并重建后,索引又大大缩小。例如,原来的索引文件有1g,我先删除然后重新建个一模一样的索引,一般只有600m左右。
是什么原因导致了索引文件大小的不一致?看了下help,里面说索引文件包含了key值以及他对应的观测号。我猜测,是由于该索引非unique的原因,但具体机制还没搞明白。论坛的各位SAS高手请帮我解惑吧。