说明:
1、数据分析只需要年度、月份、筛查人次数合计这3个变量,
2、年度=2011、月份=2、筛查人次数合计=817的观测有4条,
3、因为筛查人次数合计数817已经包括了其他人群分类类型筛查人次数(不育129、不孕133、供精者27、其他345),
4、
所以这4条观测记录我只需要保留1条记录就满足我需要的数据了,
类似于这4条观测的情况还有很多。
根据说明,
请问除了用 nodupkeys这个选项外,
是否还有其他方法能够实现这个数据要求。
proc sort out=hiv
nodupkeys;
by id _COL1 _COL74;
run;
*******************************************************************************************************************;
proc import datafile='D:\nodupkeys.xls' out=a dbms=excel replace; sheet='sheet1$'; getnames=yes; run;
data a;set a;
keep _COL0-_COL1 _COL74; *_col0='年度‘, _col1='月份', _col74='筛查人次数合计';
run;
proc sort data=a;
by _COL0;
run;
data hiv;
set a;
rename _COL0=id;
run;
proc sort data=hiv;
by id _COL1;
run;
proc sort out=hiv
nodupkeys;
by id _COL1 _COL74;
run;