全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
23071 10
2012-05-03
我想请问一下,在SAS里面,得到了一个有两百多万条观测的数据集,选定一个变量,如何让SAS自动查找变量值相同的观测并计算个数,并输出一张表,把不同变量值的重复观测数列出来。前提是我不知道该变量都有哪些取值,数据太多了很难人工记录。希望论坛有人能热心指导下,谢谢~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-5-3 15:10:25
你可以参考一下proc sort过程,里面有个nonupkey选项可以实现你说的功能,如果这个不能刻试一下sql
大致可以这样吧:
proc sql;
create table a as
select  x1,count(*) as n
from  a
group by x1
having calculated n>=2
;
quit;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-5-3 15:21:17
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-5-3 15:31:47
正解
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-5-10 22:26:38
thanks, good to learn.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-8-9 14:51:28
用proc freq过程,
data freq data=数据集;
table 变量;
run;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群