全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
23514 22
2008-09-05

经过合并几个数据集后,发现新的数据集里有些行是重复的,有的重复了多次,如何删除这些重复的(只保留第一个就够了)?

比如:

name        subject      score

david          chinese      89

david         english      90

david           english      90      (这个重复了)

david          maths         78

david         maths         78     

david          maths           78      (这个也重复了,而且重复2次)

jack           chinese        99 

jack             chinese       99     (也重复)

jack            english        70

.................................

后面数据还有很多,不光是david,jack的重复了。

也就是怎么能够用最简单的方法,把同名 同课 同成绩的行去掉?

希望各位给点见解,谢谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2008-9-5 09:29:00
Try the Proc Sort

Proc Sort nodupkey;
  By name subject score;
Run;

The code will delete any observation with same name, subject, and score.

Good luck on your study
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-9-5 19:45:00

nodupkey,果然可行。

多谢楼上的兄弟!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-11-27 18:14:00

楼主不妨用sql语言试试看,

proc sql;

create table b as

select distinct c(你的数据集).*

from c;

quit;

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-11-27 19:51:00

四楼兄弟,需要改成这样

proc sql;
create table b as
select distinct *  
from c;


爱萌  魅力 +2  奖励 2009-2-20 9:11:27
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-11-27 23:50:00
studying.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群