如何用PROC SQL可以简单地得出不重复的行数？

4187

收藏 2015-07-25

这个问题看起来很简单，
如
pro sql;
select count(*)... 可以得到行数，但是duplicate的行数也计算在内。

要去掉重复行数，如果写成
proc sql;
select count (distinct *)... 似乎顺利成章，但语法抱错.

而这种
proc sql;
select count(*) from (select distinct * from datatable)... 又显得有点矫情。

请教各位更好的方法。谢啦！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

马甲甲

2015-7-25 11:12:17

nodup
nodupkey

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

不是吧258123

2015-7-25 11:18:01

为什么非要用sql,用data步排序，nodup可以实现啊

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

wsddzr

2015-7-25 11:55:28

不知道下面这种行不行初学者~

复制代码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

haiimo

2015-7-25 12:00:17

Greenlane 发表于 2015-7-25 11:01
这个问题看起来很简单，
如
pro sql;

proc sort data=... nodup/nodupkey;
by...;
得到非重复的

proc summary data=....;
by...
output out=... (where _freq_ >1)
得到重复的

是不是这样？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingfeng07

2015-7-25 13:17:59

重复也要看变量，你要取哪个variable不重复的观测，就select count(distinct variable) from datasets;
如果是针对多个变量的话，可以这么写：
proc sql;
select count(*) from (select count(*) from datasets group by variable1,variable2,....,variablen);
quit;

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群