二、生成数据
1)如果不要生成最终数据集,只是处理一个过程。建立多使用:data _null_;
2)合并二个数据集的时候,如果二个数据集相关,建议使用proc apend 过程;
data one;
set one two;
run;
---方法二只是读入TWO的数据并入到ONE中。
proc append base = one data =two;
run;
3)在SET 后面直接过滤不需要的变量(set test(keep=var1);)可以避免不需要的变量进入PDV
4)建立索引。如果读入大数据量的时候,可以在读入的时候即为数据集加上索引,方便后续的高效访问(data test(index=));)
5)预编译
对于常用的生成数据过程,可以利用PGM的过程预编译好,存储起来,要使用时候,直接调用。可以节约编译器时间。
例如:
DATA one2/ pgm = progname;
SET one;
RUN ;
DATA pgm=progname ;
RUN;
三、模糊匹配
1) is missing/is null用于检查字符变量是否为空或者数值变量是否缺失。
2)%代表0个以上的任意个数的字符。
3)_(下划线)仅代表一个任意字符。
4)contains?是否包含某个字符 x ? 'afd' 相当于 x like '