各位saser,大家好!
最近我一直在考虑拿到数据后的预处理工作。以前的一次数据处理中由于预处理做的不够,导致结果不准确。
现在希望大家都能讨论下自己在预处理中都有哪些具体步骤。
我目前的方法是:
先给数据排序,然后剔重。 我剔重用 nodupkey, 看到其他人好像有用别的。不知是何道理?
有时候我会用 以下程序检查变量。
proc sql;select count(*) , count(distinct id) from data;
quit;
我的处理比较简单,不知道大家还有什么其他的处理步骤吗?