全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1824 4
2012-12-20
一个数据集中有n个字符型变量n1-nn,如果两个观测里各变量取值集合相同但顺序不同则认为是相同的观测,只保留一个,怎么做?如有3个变量n1-n3,取值为“a”“b”"c",与取值为“b”"c""a"的观测应被认为是同一个观测,只保留任意一个,可以实现吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-12-20 13:37:15
用call sortc排序就可以了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-12-20 14:11:44
ziyenano 发表于 2012-12-20 13:37
用call sortc排序就可以了
能举个例子吗?没用过
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-12-20 14:19:06
data ex;
input (n1-n3)( $);
cards;
a b c
c b a
a c b
;
run;

data ex1;
set ex;
call sortc(of n1-n3);
run;

proc sql;
create table ex2 as
select distinct * from ex1;
quit;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-12-20 14:51:08
不过上面保留的结果,都是排过序了。
用下面的程序,可以保留原始观测,这里默认保留第一个出现的观测:
data ex;
input (n1-n3)( $);
cards;
b c a
c b a
a c b
;
run;

data ex1;
set ex;
length new $50.;
call sortc(of n1-n3);
new=cats(of n1-n3);
data ex1;
merge ex1(keep=new) ex;
run;


data _null_;
if _n_=1 then do;
declare hash h();
h.definekey('new');
h.definedata('n1','n2','n3');
h.definedone();
end;
set ex1 end=last;
if h.find() then h.add();
if last then h.output(dataset:'ex2');
run;



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群