全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
3421 7
2013-06-27
我有十几个包含不同变量的数据集,每个数据集有30几个变量。针对每个数据集,我想提取它的完全重复的观测,请问该怎么编写程序,困惑了好久,热切等待高手的解答,谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-6-27 09:59:19
如果你的意思是指把重复的观测提出来,原始表格只留一个不重复的,我能想到的简单方法,先写下来

data have;
set have;
Obs=_N_;
run;

proc sort data=have out=have_nodup nodupkey;
run;

proc sql noprint;
create table want as
select * from have
where Obs not in (select Obs from have_nodup);
run;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-6-27 10:08:37
提供下stata程序:
use data,clear
duplicates tag, g(newvar)
keep if newvar>=1
duplicates drop
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-6-27 14:34:37
playmore 发表于 2013-6-27 09:59
如果你的意思是指把重复的观测提出来,原始表格只留一个不重复的,我能想到的简单方法,先写下来

data h ...
谢谢二楼的回复,不过运行之后显示如下错误:没有使用 BY 语句或没有指定 BY 变量。BY 语句必须与要排序的变量名一起使用。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-6-27 14:38:47
maybe
复制代码

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-6-27 14:43:00
tangjingdong506 发表于 2013-6-27 14:34
谢谢二楼的回复,不过运行之后显示如下错误:没有使用 BY 语句或没有指定 BY 变量。BY 语句必须与要排序的 ...
嗯,按你的表格排序变量,在proc sort里加上by子句就好了
你没写明表格内容,我也就忘写了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群