全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
2083 7
2019-02-11
id year amount
1 2009 10000
1 2010 666
1 2011 .
1 2011 888
1 2012 9999
2 2010 500
2 2010 6000
2 2011 .
2 2012 4444
如表,我想删除的步骤是这样的:首先,检验id、year的重复,比如表中的 1-2011重复了两次,2-2010重复了两次。然后,看重复变量对应的amount的值,优先保留数值大的和存在的。
也就是我希望得到如下的结果
id year amount
1 2009 10000
1 2010 666
1 2011 888
1 2012 9999
2 2010 6000
2 2011 .
2 2012 4444
这个语句该怎么写呢。。。?求各位大佬帮助!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-2-11 02:35:24
duplicates drop
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-2-11 07:53:25
你若要问程序,永远附上相关资料;若附上资料,永远用 dataex 印出资料。
1.        先 ssc install dataex (并见说明),将原始 Stata 资料中具有”代表性”的一部分资料列出,以供有意回答者实验之用,并能提供具体操作指令。
2.        并请参考 http://www.jianshu.com/p/9870080fe769,  https://bbs.pinggu.org/thread-5048204-1-1.html, 与 https://bbs.pinggu.org/thread-5917273-1-1.html
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-2-11 11:01:05
xiyuhuanghun 发表于 2019-2-11 02:35
duplicates drop
嗯嗯我知道这个,可是这个删除的时候没办法保留我需要的那个条件。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-2-11 11:27:29
黃河泉 发表于 2019-2-11 07:53
你若要问程序,永远附上相关资料;若附上资料,永远用 dataex 印出资料。
1.        先 ssc install dataex (并见 ...
谢谢老师提醒,资料如下。我希望删除的是 4 2017 . 和 5 2017 80160 这两条数据,就是以Stkcd 和year先判断是否存在重复,如果重复的话就删除缺失值和较小值的数据。
* Example generated by -dataex-. To install: ssc install dataex
clear
input long Stkcd int year double Amount
4 2007     598120
4 2008      64400
4 2009          .
4 2015     134772
4 2016  130617.67
4 2017       4000
4 2017          .
5 2010    43438.4
5 2011          .
5 2015    5345059
5 2016  2911384.4
5 2017      80160
5 2017 1823975.84
6 2007    3473200
6 2008  587904.69
end
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-2-11 11:40:40
蠢猫猫 发表于 2019-2-11 11:27
谢谢老师提醒,资料如下。我希望删除的是 4 2017 . 和 5 2017 80160 这两条数据,就是以Stkcd 和year先判 ...
试试
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群