全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
14850 8
2010-05-29
我是SAS的初学者。

我有以下的数据。
Data raw;
Input PatientID $
1-5 weight 7- 9.
Age 10- 14 med_ml
15-17;

Datalines;
1234


50

35
20

1234
55
35
10

1234
50
36
10

4567
67
34
15

4567
67
35
20

;
我只想留下Unique PatientID。比方说,一个1234和4567。

为了避免PatientID重复,我用了Nodupkey来过滤。


Proc sort data=raw out=prescribe NODUPKEY;
By PatientID age;
Run;

请问有谁知道Nodupkey如何(用什么规制) 过滤PatientID. 只取PatientID=1234第一个的observation?或最后的observation

向各位请教了。谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-5-29 12:54:47
可惜不会。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-5-29 13:06:30
Data raw;
Input PatientID $
weight  
Age  med_ml
@@;
Datalines;
1234


50

35
20
1234
55
35
10
1234
50
36
10
4567
67
34
15
4567
67
35
20
;

run;
  
proc sort;by PatientID;run;
data final;set raw;by PatientID;
if first.PatientID ;run;

/*需要最后一个改成  last.PatientID */
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-5-29 14:22:13
如果只想留下Unique的 PatientID,那你就by PatientID. 你上面的程序by PatientID  Age, 那么将去掉PatientID  Age同时相同的observation.

Data raw;
Input PatientID $ weight Age med_ml ;
Datalines;
1234 50 35 20
1234 55 35 10
1234 50 36 10
4567 67 34 15
4567 67 35 20
;
run;
proc sort data=raw out=a nodupkey;
by PatientID;
run;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-5-30 00:49:45
sort nodupkey可以看成两步:先排序,然后remove重复的。
nodupkey只是负责按var排序好之后把first.var留下,其他remove掉。
所以如果排序之后的observation的前后关系和原数据一样,那么out的结果就是取出现的第一条记录。
即:数据集:
1 3
2 1
1 4
对第一个变量排序,如果结果是
1 3
1 4
2 1
那么remove的就是1 4

另一种排序结果是
1 4
1 3
2 1
那么remove的就1 3。

所以排序过程是否保留原数据集的中前后关系,和nodupkey无关,是受另一个option(equals)的影响。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-5-30 13:18:59
Many thanks for the advices!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群