全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
4007 3
2010-10-16
就是duplicate record
key variable是mother‘s date of birth,race
怎么写程序呢?
谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-10-16 07:57:49
data test;
    input dob : yymmdd8. race $;
        format dob yymmdd10.;
    datalines;
19550101 a
19560102 b
19560102 b
19570103 c
19570103 d
19580104 e
19590105 f
19600106 g
19600106 g
;

*** Solution 1;
proc sort data=test out=aaa dupout=bbb nodupkey ;
     by dob race;
run;

*** Solution 2;
proc sql;
     create table ccc as
            select distinct dob,race
                  from test
                  group by dob,race
                  having count(*)>1;
quit;

*** Solution 3;
data ddd;
     set test;
         by dob race;
         if not first.race;
run;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-10-16 20:31:01
Ron Cody 的Data.Cleaning.Techniques.Using.SAS有詳細講解
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-10-16 22:39:37
use DUPOUT

PROC SORT DATA=dedupe_demo NODUPKEY DUPOUT=nodup_by_key  OUT=nodup_by_key ;
  BY date_of_birth race;
RUN;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群