全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
6223 8
2016-10-30
我现在数据库来源很复杂,变量很多。我想先通过姓名变量和城市变量输出相同的观测值,然后具体选择保留那一条需要人工选出。我目前已经将duplicates的名单处理完,需要和之前的库合并,但需要剔除duplicates的库不含有之前任何的重复变量。所以要如何删除所有重复观测,一个都不留。谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-10-30 17:31:15
use
proc sort data=aa nodupkey;
by city name;
run;

go to the SAS help for the details
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-10-30 17:35:35
THANKS! I'VE ALREADY SOLVED THE PROBLEM WITH FIRST.VAR AND LAST.VAR THEN OUTPUT.THANKS ANYWAY
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-10-30 19:53:17
data test;
input id name $ city $ other;
cards;
1 张三 北京 1
2 李四 上海 1
3 李四 上海 2
4 王五 北京 1
;
run;

proc sort data=test out=test1;
by name city;
run;

data test2;
set test1;
by name city;
if first.city=last.city;
run;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-12-28 15:29:50
如果保留第一项呢,代码怎么写
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-12-28 15:30:47
l1i2n3i4n5g 发表于 2016-10-30 19:53
data test;
input id name $ city $ other;
cards;
如果保留重复中的第一项,代码怎么写
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群