全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
4161 3
2010-10-08
本人正在整理包含几十万个单元的数据库,在浏览数据时,发现原始数据库中存在重复录入的情况。想通过指令来查找到重复录入的那些个体单元的数据,并将其删除,仅保留一个。我所说的个体单元有专门的代码识别,每个个体单元又包括很多项指标值。
比如:001——1,2,3
            002——2,5,4
            015——6,5,8
            015——6,5,8
            120——7,2,1
            204——2,5,8
在上面的数据库中,015单元重复输入了两次,如何编程才能够找到015这个重复的单元,并将多输入的重复内容删掉,仅保留一个?
查了手头的资料,都没有关于此问题的解答。希望知道的同学帮帮忙,告知如何处理此种情况,谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-10-8 21:59:32
help duplicates
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-10-9 10:43:51
duplicates drop xxx, force
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-10-10 08:36:09
附件:数据库查找.rar(3K)下载次数:2
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群