全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
4285 3
2016-08-23
在 proc sort 过程中使用nodupkey选项,和直接排序后再用if.first var 或 if.last var去重,有区别吗?
nodupkey选项在删除重复记录时,是按原数据集的顺序只保留第一个,还是排序后的顺序只保留第一个?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-8-24 07:08:46
nodupkey选项在删除重复记录时,先排序,然后比较相邻两行的by var,去掉the second duplicate。排序时,按照原数据集的顺序根据by var来排列。

data best;
input patient 1-2 arm $ 4-5 bestres $ 6-7 delay 9-10;
datalines;
01 A CR 0
02 A PD 1
03 B PR 1
05 C SD 1
06 C SD 3
07 C PD 2
01 A CR 0
03 B PD 1
;

proc sort data=best nodupkey out=ex4;
             by arm;
run;

PATIENT ARM BESTRES  DELAY
01 A CR       0
03 B PR       1
05 C SD       1


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-8-24 07:13:04
nodupkey 和 first.var 两者可以做出同样的结果. 需要看具体问题。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-8-25 09:28:36
violinj 发表于 2016-8-24 07:13
nodupkey 和 first.var 两者可以做出同样的结果. 需要看具体问题。
OK,谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群