关于SAS (NODUPKEY) 的问题！

14940

收藏 2010-05-29

我是SAS的初学者。

我有以下的数据。
Data raw;
Input PatientID $
1-5 weight 7- 9.
Age 10- 14 med_ml
15-17;
Datalines;
1234

50

35
20
1234
55
35
10
1234
50
36
10
4567
67
34
15
4567
67
35
20
;
我只想留下Unique的 PatientID。比方说，一个１２３４和４５６７。

为了避免PatientID有重复，我用了Nodupkey来过滤。

Proc sort data=raw out=prescribe NODUPKEY;
By PatientID age;
Run;

请问有谁知道Nodupkey如何(用什么规制) 过滤PatientID.　只取PatientID=1234的第一个的observation？或最后的observation？

向各位请教了。谢谢！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

zhoupuhan

2010-5-29 12:54:47

可惜不会。。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

xiaosanmao

2010-5-29 13:06:30

Data raw;
Input PatientID $
weight
Age  med_ml
@@;
Datalines;
1234

50

35
20
1234
55
35
10
1234
50
36
10
4567
67
34
15
4567
67
35
20
;

run;

proc sort;by PatientID;run;
data final;set raw;by PatientID;
if first.PatientID ;run;

/*需要最后一个改成  last.PatientID */

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

dankdark

2010-5-29 14:22:13

如果只想留下Unique的 PatientID，那你就by PatientID. 你上面的程序by PatientID Age, 那么将去掉PatientID Age同时相同的observation.

Data raw;
Input PatientID $ weight Age med_ml ;
Datalines;
1234 50 35 20
1234 55 35 10
1234 50 36 10
4567 67 34 15
4567 67 35 20
;
run;
proc sort data=raw out=a nodupkey;
by PatientID;
run;

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

yatming

2010-5-30 00:49:45

sort nodupkey可以看成两步：先排序，然后remove重复的。
nodupkey只是负责按var排序好之后把first.var留下，其他remove掉。
所以如果排序之后的observation的前后关系和原数据一样，那么out的结果就是取出现的第一条记录。
即：数据集：
1 3
2 1
1 4
对第一个变量排序，如果结果是
1 3
1 4
2 1
那么remove的就是1 4

另一种排序结果是
1 4
1 3
2 1
那么remove的就1 3。

所以排序过程是否保留原数据集的中前后关系，和nodupkey无关，是受另一个option(equals)的影响。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

esther09

2010-5-30 13:18:59

Many thanks for the advices!

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群