全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
1533 4
2013-03-23
AB C
1KG10
1KG32
1TON24
1KG14
1TON16
2DOZ67
2TON34
2DOZ32
有A,B,C三个变量,A为代码1——1000,B为单位,C是产量,现在想计算C的值,但要求单位B一致。因此首先需要找出每个代码下出现次数最多的单位作为基础单位,例如A=1时为KG,A=2时为DOZ,依次类推。。。然后删掉其他与基础单位不一致的变量,请问用什么方法可以实现呢。。。。各位网友帮忙解答一下啊,多谢~~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-3-23 20:15:56
也就是对于每一个A,找出B中出现次数最多的单位做基础单位,把其余的非基础单位DROP掉,求助啊啊啊啊~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-3-23 21:53:22
Assume "selection" if your file name, a, b, c is your variables, the following should work:

use selection, clear
contract a b
bysort a (_freq): keep if _freq==_freq[_N]
merge 1:m a b using selection, keep(match) nogen
sort a b
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-3-23 21:56:29
Sorry:
Assume "selection" is your file name, a, b, c are your variables, the above should work:
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-3-23 22:23:55
Here is another (better) way:

use selection, clear
bysort a b: egen total=count(a)
bysort a (total): keep if total==total[_N]
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群