各位大侠,我有一个数据文件,包含若干变量,其中很多变量具有数据遗失。比如下面这个包含4个变量的例子:
DATA Test;
INPUT age income education weight;
DATALINES;
1 2 4
. 5 . .
. 8 5 2
6 7 . .
9 . . 3
1 2 3 .
4 . . 5
;
RUN;
请教各位大侠,如何使用SAS DATA或者PROC SQL依次进行如下两步操作:
第一步: 如果一个变量超过20%数据遗失,那么就把这个变量从数据文件中删除。通俗一点,我想检查包含数据遗失情况,如果一个变量数据遗失情况严重,则将这个变量删除。
第二步:如果一行数据中任意一个变量具有数据遗失,则将这行数据删除。
如果我的问题没有完全描述清楚,那么尽情按照您的理解提供相应答案。无论大侠提供SAS CODE给第一步,或第二步,鄙人感激不尽。
如果变量数目很多,需要进行重复操作。这可能会要用到宏。如有可能,如能将如上两步程序用宏进行封装更佳,但是,并不奢求。