悬赏 50 个论坛币 已解决
最近在撰写毕业论文时遇到一个变量生成的stata编程问题,该变量是毕业论文里面的核心变量,但是一直没能求解出来,不知道各位老师能不能帮我看看,谢谢各位!
问题描述如下(不知道有没有把问题描述清楚,我主要想知道生成ratio变量的stata程序):
原数据结构如下:
* Example generated by -dataex-. To install: ssc install dataex
clear
input byte(familyid gender) int income
1 1 200
1 0 150
2 1 300
2 0 250
2 0 350
2 1 400
4 0 300
4 1 200
end
FamilyID代表家庭编号,gender=1表示男性,我想求每个家庭里女性收入大于男性收入的概率(ratio),也就是先算第i个女性收入超过男性的概率,再计算各女性超过男性收入的平均值,以第二个家庭为例,第二个家庭第一个女性收入超过男性的概率为0(超过几个男性/男性总数),第二个家庭第二个女性收入超过男性的概率为0.5,所以第二个家庭ratio=(0+0.5)/2=0.25(ratio为各女性超过男性收入概率的平均值),最后得出的数据应为
* Example generated by -dataex-. To install: ssc install dataex
clear
input byte(familyid gender) int income float ratio
1 1 200 0
1 0 150 0
2 1 300 .25
2 0 250 .25
2 0 350 .25
2 1 400 .25
4 0 300 1
4 1 200 1
end