全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
4085 6
2009-04-08
请求各位,现在小弟刚学stata,遇到如下问题,请指教: (数据行达几万,不可能通过单击删除)
var1 var2 var2 var4 var5
x ddd rr rr rr
x ddd rr rr
x dd rr rr
y dd r
y ddd rr
y dd rr
z ddd rr
z dd
s dd
s dd
s dd
问题:要保留上表中var1出现相同的字符达三次的各行,即要删除没有重复出现三次的观测值。
请求命令!谢谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2009-4-9 06:24:00

*重复四次及以上的,是否删除?

bys var1: egen s=count(var1)

keep if s==3

drop s

*以上只保留var1出现相同字符恰为三次的各行

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-4-9 10:04:00
只要保留最高重复次数的,谢谢你的回复!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-4-9 10:11:00
命令相当成功,谢谢版主!省了我不少时间哦!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-4-9 16:49:00

另有问题:如果var2中有小于等于0的值,则删除此记录,并同时删除与此记录var1同名的所有记录,应该怎么操作?请大侠指教。谢谢!如上表中第一条y的var2出现<=0的值,则删除它,同时删除其他两个y记录。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-4-9 22:20:00
以下是引用abnerfoo在2009-4-9 16:49:00的发言:另有问题:如果var2中有小于等于0的值,则删除此记录,并同时删除与此记录var1同名的所有记录,应该怎么操作?请大侠指教。谢谢!如上表中第一条y的var2出现<=0的值,则删除它,同时删除其他两个y记录。

bys var1: egen m=min(var2)

drop if m<=0

drop m

*对于var1相同的观测值,只要其中有观测值的var2非正,则删除全部这些var1相同的观测值。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群