全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
5736 9
2014-09-29
在用stata做数据处理时,我遇到了一个问题,恳请大家的帮助,表格中左边是家庭代码,数值相同表示一个家庭,右边是家庭成员的出身日期,请问如果我想删除一个家庭中年龄差距小于20岁的样本应该如何操作?因为有些家庭有三个成员,只需计算只有两个家庭成员的样本,就是说如果两个家庭的年龄差距小于20岁,就把这个家庭样本删除,非常感谢!

附件列表
MR`RMKA%CG7I]_1BP[1BIRP.jpg

原图尺寸 20.4 KB

MR`RMKA%CG7I]_1BP[1BIRP.jpg

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-9-29 13:53:43
先生成年龄gen age=2014-qaly+1
by fid, sort: egen max=max(age)

. by fid, sort: egen min=min(age)


. gen gap=max-min

. drop if gap<=20
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-9-29 16:47:21
这个不属于重复数值的处理问题
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-9-29 18:20:07
leewinjing 发表于 2014-9-29 13:53
先生成年龄gen age=2014-qaly+1
by fid, sort: egen max=max(age)
真是太感谢你了!这个方法很好,我还有两个问题,不知你能否帮我一下,第一个是因为有些家庭有三个或以上人数,那么如果我想保留年龄从大到小在前两位的成员,删除这个家庭中剩下的成员,该怎么办?第二个问题是:如果第一个问题解决了,那每个家庭只有两个成员了,那我怎么样才能把他们分开?比如年龄较大者为父亲变量,年龄较小者为儿子变量,具体一点就是因为我有每个成员的收入数据,我需要生成一个父亲变量和一个儿子变量,变量值就是他们的收入,然后就是把父亲和儿子做回归。真心希望您能帮我解决这个忙,感激不尽!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-9-29 21:39:55
假设你上面的变量还有一个叫做income
问题1:
sort fid qaly
bys fid: gen ord=_n
drop if ord>2
问题2:
reshape wide qaly income, i(fid) j(ord)
然后就可以回归了,qaly1,income1是父亲,qaly2,income2是儿子
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-9-30 14:55:14
xiaofengshen 发表于 2014-9-29 21:39
假设你上面的变量还有一个叫做income
问题1:
sort fid qaly
谢谢!在运行过程有一个问题就是我一个样本有几百个变量,变成宽的的话好像不匹配,是不是需要弄到excel里先?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群