现在有几个数据集,每个数据集都包含一列变量PLY_NO,我希望将这几个数据集按PLY_NO合并在一起。具体是将A数据集中的PLY_NO作为参考,B,C...中如含有A中没有的PLY_NO,则此观测可忽略。
也就是说如果使用proc sql select from,A可以作为左连接左边的数据集。
问题是数据集compress过,用proc sql; create table lib.data as select * from这个方法非常慢,生成的临时文件也是原数据集的几十倍大。
有没有其他方法可以合并呢?
如果只在一个数据集中选取某几个列,我发现data set比proc sql快很多。
各位达达,盼指点。