全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
7346 6
2010-08-05
请教个很弱的问题:
我想找出变量A(字符串型)中那些完全相同的字符串,并把这些相同字符串列出来,请问有什么命令能实现呢?
如果变量A是数值型,那又用什么命令实现同样目的呢?
谢谢各位高手能人!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-8-5 10:32:50
我不知道!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-8-5 12:18:40
最好给出一个例子,摆出原始数据,并说明你想要的结果。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-8-5 13:27:51
谢谢版主!:)
比如,变量dm(字符串型),记录分别是AA1,AA2,AA3,AA4,……AA100,这100个记录应该各不相同。但是,现在出现了重复记录,即AA1,AA2,AA3,AA4,……AAn,…AAn,…AA99。我现在需要做的就是,把重复的那个记录找出来,然后剔除掉。
而且现在,我只知道有重复记录,但不知道是哪个重复了。原始记录庞大,没法用肉眼搜。

而且,我觉得,这查找的原理其实与codebook指令的原理是一样的,但是,不知道又怎样的命令能实现此操作。

版主高见?  :)))
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-8-5 13:55:01
*只是删除dm中的重复观测值:
duplicates drop dm,force
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-8-5 13:56:39
*查看dm的每种观测值各重复几次:
g n=1
collapse (count)n ,by(dm)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群