全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
9927 10
2018-02-11
正在整理数据库,想要把某个变量有重复值的观测值全部删除。但是我用proc sort nodupkey,结果总是保留重复值的第一个。因为数据量很大,没办法手工删除。所以我的问题是如何删掉全部重复的观测值,不保留第一个相同观测值?请各位大大指教,谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-2-12 06:58:35
先count 你的key, 然后在delete count值大于1的observation不就好了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-2-12 08:40:57
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-2-12 09:46:54
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-2-12 20:57:45
舍身卫道 发表于 2018-2-12 09:46
非常感谢!!把程序运行了一下,得到这样的结果。所有的重复值都删掉了!
附件列表
0012.jpg

原图尺寸 107.12 KB

运行结果

运行结果

0012.jpg

原图尺寸 107.12 KB

0012.jpg

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-2-12 21:07:56
l1i2n3i4n5g 发表于 2018-2-12 08:40
这是运行结果,1这个重复值在结果里面还有。
附件列表
221.jpg

原图尺寸 6.97 KB

221.jpg

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群