江湖救急——SAS如何删除数据集中的重复记录

进行式

13023

收藏 2014-01-14

数据集中有大量记录，有几列变量的观测值都有十几条重复记录。该怎么写程序删除呢？谢谢了
我主要是想根据其中ID、L两个变量来删除观测，因为有些ID的观测值在L中有多个记录。如图

附件列表

WE$BH$5MX{EJTR3$J~_DVG0.jpg

原图尺寸 63.19 KB

$WE$BH$5MX{EJTR3$J~_DVG0.jpg$

PN%_6PN]S_%5~NH$GF`U[M6.jpg

原图尺寸 130.65 KB

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

jy06056064

2014-1-14 11:21:55

proc sort nodupkey;

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

xiaoyu163

2014-1-14 11:29:25

看不到图，我来假设你的数据中只有两个变量: ID 和 L，然后数据类似T1, 先排序，然后每个ID只选择一个record，具体程序如下:

data T1;
  input ID L;
  cards;
1 10
1 20
2 10
1 30
2 15
;
run;
proc print; title "Table for T1"; run;

proc sort data=T1 out=T2;
  by ID L;
run;
proc print; title "Table for T2"; run;

data T2;
  set T1;
  by ID L;
  if ^first.ID then delete;
run;
proc print; title "Table for T2: No Duplicated ID"; run;

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

zw612003

2014-1-14 13:15:29

jy06056064 发表于 2014-1-14 11:21
proc sort nodupkey;

proc sort data= out= nodupkey;
by id L;
run;

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

进行式

2014-1-14 15:44:33

xiaoyu163 发表于 2014-1-14 11:29
看不到图，我来假设你的数据中只有两个变量: ID 和 L，然后数据类似T1, 先排序，然后每个ID只选择一个recor ...

恩，谢谢哈。可是我这个数据处理有点麻烦，因为如果我按我每个ID只保留一个观测值我会丢失L中的不同观测。如果我按L筛选，又会丢失ID。我想要的结果是每个ID对应的L是唯一的
数据结构就像这样
ID    L
1    0
1    0
1    0
1    1
1    1
2    1
2    1

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

420948492

2014-1-14 18:50:09

zw612003 发表于 2014-1-14 13:15
proc sort data= out= nodupkey;
by id L;
run;

正解

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

牵你↗左手

2014-1-15 08:37:04

proc sort data=a out=b;
by id l;
run;
data c;
set b;
by id l;
if first.l;
run;

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

进行式

2014-1-16 20:25:20

牵你↗左手发表于 2014-1-15 08:37
proc sort data=a out=b;
by id l;
run;

非常感谢！但是运行出的结果有点小问题，因为我的数据中ID号的前几位数是相同的。运行完程序后，部分ID数据的前几位数也被删除了。如图，有些ID运行完之后变成00068前几位的110012也被删除了。这是什么原因呢？谢谢解答哈

附件列表

W_`OX@[VM74MS4XEEK8W_U1.jpg

原图尺寸 51.27 KB

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

牵你↗左手

2014-1-17 09:04:23

进行式发表于 2014-1-16 20:25
非常感谢！但是运行出的结果有点小问题，因为我的数据中ID号的前几位数是相同的。运行完程序后，部分ID数 ...

你有没有一直变量的长度？我试了下是没有问题的

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

进行式

2014-1-17 09:21:18

牵你↗左手发表于 2014-1-17 09:04
你有没有一直变量的长度？我试了下是没有问题的

什么是一直变量的长度？就是有一部分数据的ID会变化，大部分都还是对的。是不是跟数据的列属性或者读取的变量长度有关？出现的情况如图。

附件列表

8_Y_DY{(LIAQ2XZO04UY4$X.jpg

原图尺寸 54.83 KB

$8_Y_DY{(LIAQ2XZO04UY4$X.jpg$

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

dengrong1989

2014-1-17 09:48:27

学习了，呵呵

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

牵你↗左手

2014-1-17 14:56:17

进行式发表于 2014-1-17 09:21
什么是一直变量的长度？就是有一部分数据的ID会变化，大部分都还是对的。是不是跟数据的列属性或者读取的 ...

不还意思，打错了，抑制。
要不你把代码贴上来看看

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

进行式

2014-1-17 16:38:12

恩，谢谢哈。代码就是用的您之前指导的那个，出现这种情况是不是跟变量的类型（字符型、数字型）有关？
proc sort data=a out=b;
by id l;
run;
data c;
set b;
by id l;
if first.l;
run;

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

进行式

2014-1-17 16:38:50

牵你↗左手发表于 2014-1-17 14:56
不还意思，打错了，抑制。
要不你把代码贴上来看看

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

牵你↗左手

2014-1-17 16:45:19

不应该啊。我用数值型试的，没有出现截断的情况啊，你改下格式试试，不要定义长度

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

进行式

2014-1-18 14:55:30

牵你↗左手发表于 2014-1-17 16:45
不应该啊。我用数值型试的，没有出现截断的情况啊，你改下格式试试，不要定义长度

恩，谢谢哈。我再试试，可是奇怪的是有一部分数据出现了这种情况，其他都还没问题。现在还是不知道怎么解决，而且我还不太会修改格式把字符型的改为数字型，还得向您请教。多谢了！

附件列表

BQPCI$6`~V7KG[YQKO){MTS.jpg

原图尺寸 25.34 KB

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

牵你↗左手

2014-1-18 19:29:47

进行式发表于 2014-1-18 14:55
恩，谢谢哈。我再试试，可是奇怪的是有一部分数据出现了这种情况，其他都还没问题。现在还是不知道怎么解 ...

INPUT(ID,8.);

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

summerwe

2017-7-10 15:11:11

xiaoyu163 发表于 2014-1-14 11:29
看不到图，我来假设你的数据中只有两个变量: ID 和 L，然后数据类似T1, 先排序，然后每个ID只选择一个recor ...

你这程序跑出来是错的啊

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

18353151352

2018-10-17 21:47:36

xiaoyu163 发表于 2014-1-14 11:29
看不到图，我来假设你的数据中只有两个变量: ID 和 L，然后数据类似T1, 先排序，然后每个ID只选择一个recor ...

^first.ID
您好，想问下这个是什么意思？SAS新手。。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

不爱吃芒果

2021-8-10 13:23:14

zw612003 发表于 2014-1-14 13:15
proc sort data= out= nodupkey;
by id L;
run;

好用好用正解

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群