[求助]如何删除重复的行

funwin

23711

收藏 2008-09-05

经过合并几个数据集后，发现新的数据集里有些行是重复的，有的重复了多次，如何删除这些重复的（只保留第一个就够了）？

比如：

name subject score

david chinese 89

david english 90

david english 90 (这个重复了）

david maths 78

david maths 78 (这个也重复了,而且重复2次）

jack chinese 99

jack chinese 99 (也重复)

jack english 70

.................................

后面数据还有很多，不光是david，jack的重复了。

也就是怎么能够用最简单的方法，把同名同课同成绩的行去掉？

希望各位给点见解，谢谢！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

SignPingGu

2008-9-5 09:29:00

Try the Proc Sort

Proc Sort nodupkey;
By name subject score;
Run;

The code will delete any observation with same name, subject, and score.

Good luck on your study

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

funwin

2008-9-5 19:45:00

nodupkey,果然可行。

多谢楼上的兄弟！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

pandasasa

2008-11-27 18:14:00

楼主不妨用sql语言试试看,

proc sql;

create table b as

select distinct c(你的数据集).*

from c;

quit;

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

wxq1638

2008-11-27 19:51:00

四楼兄弟，需要改成这样

proc sql;
create table b as
select distinct *
from c;

爱萌魅力 +2 奖励 2009-2-20 9:11:27

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

wanna_sas

2008-11-27 23:50:00

studying.

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

pandasasa

2008-11-29 19:57:00

五楼的哥们，distinct后面需要加上数据集和变量名的，全选的话是格式是set.*

其中set是你要修改的目标数据集。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

panpanys

2008-12-1 08:57:00

高手啊,不错,学习中

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

byunhh

2008-12-10 18:33:00

学习：）

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

firstknife

2009-2-19 09:37:00

高手啊，正在学习中

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

456852

2009-2-21 08:12:00

proc sort那个方法不会全删除，有重复信息会留下一条，这点要注意。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

kwind_hw

2009-2-23 12:45:00

学习中。。。。。。。。。。。。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

wangchan200604

2009-2-23 17:12:00

proc sort noduprecs;

好像也可以删除完全重复的多条记录，只保留1个，可以试试看。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

huntwind

2010-8-9 03:27:58

proc sort noduprecs;是个快捷的好方法！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

anniegirl

2010-8-13 17:28:54

学习啦！……

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

rdzr

2010-8-13 17:57:47

试一试下面的程序，看可行否？

data a;
input name  $    subject  $ score;
cards;
david       chinese    89
david       english    90
david       english    90  /* (这个重复了）*/
david       maths       78
david       maths       78 /* (这个重复了）*/
david       maths       78 /* (这个重复了）*/
jack       chinese    99
jack       chinese    99 /* (这个重复了）*/
jack       english    70
;
proc sort;
by name subject;
data b;
set a;
  by name subject;
  if last.name or last.subject；
run;

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

sushe1527

2010-8-13 18:07:00

又见挖坟贴

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

rdzr

2010-8-14 12:59:32

sushe1527 发表于 2010-8-13 18:07
又见挖坟贴

兄弟，积点阴德吧，小心你家祖坟被挖！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

cufejinrong

2011-10-19 19:53:07

很好，也解决了我的问题

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

rasun

2013-1-7 17:10:20

学习下

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

jjing11

2016-6-9 21:26:44

456852 发表于 2009-2-21 08:12
proc sort那个方法不会全删除，有重复信息会留下一条，这点要注意。

那如果想要只要重复了都删除，一条也不留应该怎么办呢？求助~~~

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

shan0223

2016-9-13 09:36:20

回答楼上兄弟
proc sort a;
by name subject;
data b;
set a;
by name subject;
if first.name and last.subject；
run;

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

linshuhe123

2016-9-13 10:42:43

nodupkey 总是记不住

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群