全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 统计软件培训班VIP答疑区
1731 1
2010-04-28
请教连老师两个命令


householdnumber line(household下的个人)  year    income     father mother
211                       1                                      1991       200         .        .
211                       1                                      1993       300         .        .
211                       2                                      1993       320         1        1
212                       1                                      1993       200         .         .
212                       1                                      1995       230         .         .
212                       2                                      1993       210         .         .

如上panel data 请问如何写code得到下面两个结果

(1) drop 掉 father 和mother 同时等于缺失值的同一household的所有个人的观测值。 如上表的212应删除 , 如果在同一个household下只要出现father和mother的非缺失值 则保留该household的信息 即上表中211household中的所有个人信息
        我用的语句是
         gen n=1;  bys householdnumber: egen size=sum(n) if father==1 | mother==1; drop if n~=.    可是如果这样211  1中的两个个人观测值也都被删了 不知code该如何写才正确呢?

(2) 在同一个household的同一个年份下  如 obs house  line year  inc   fa  mo              (问题1数据的部分截取)
                                                                     1。  211      1    1993  300   .    .
                                                                      2。   211    2    1993  200  1   1
           只对fa mo为缺失值的observation进行回归 但是回归时inc需用同一household下 相同年份的父母收入替代  如observation1中的300 需用 2中的200代替 也就是说用父母的收入做小孩收入的工具变量  fa或mo为1时表示此观测值为父母的   若父母的收入均存在 则用父亲的收入替代

怕没讲明白 再具体一些的意思如下:
      首先 我并不是对所有的观测值回归 而只是对fa 和 mo存在缺失值的观测值当做cross-section单独回归 如上述观测值1才满足条件 2因为fa mo 不为缺失值 所以在reg时希望将它排除在reg的命令之外
     其次 在对所选的的fa mo为缺失值的回归中 income数据并不是用个体自己的 而是用同一个household下相对应的父母收入做工具变量替代 比如1中的income300 需用2中的200替代 而且他们必须是同一年份下(如上述1993)的情况才可替代 问题在于我的数据是panel 会有很多不同的年份 不知道用什么语句才能让其选出在同一个household下的相同年份的个体及其父母数据 并只对个体进行回归 且回归的自变量收入需用相对应的父母收入代替?
挺多限制条件的 希望老师明白我意思了 非常非常感谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-4-29 09:38:05
clu43 发表于 2010-4-28 15:00
请教连老师两个命令


householdnumber line(household下的个人)  year    income     father mother
211                       1                                      1991       200         .        .
211                       1                                      1993       300         .        .
211                       2                                      1993       320         1        1
212                       1                                      1993       200         .         .
212                       1                                      1995       230         .         .
212                       2                                      1993       210         .         .

如上panel data 请问如何写code得到下面两个结果

(1) drop 掉 father 和mother 同时等于缺失值的同一household的所有个人的观测值。 如上表的212应删除 , 如果在同一个household下只要出现father和mother的非缺失值 则保留该household的信息 即上表中211household中的所有个人信息
        我用的语句是
         gen n=1;  bys householdnumber: egen size=sum(n) if father==1 | mother==1; drop if n~=.    可是如果这样211  1中的两个个人观测值也都被删了 不知code该如何写才正确呢?

A: 命令如下:
clear
input  ///
householdnumber line       year    income     father   mother
211              1         1991       200         .        .
211              1         1993       300         .        .
211              2         1993       320         1        1
212              1         1993       200         .         .
212              1         1995       230         .         .
212              2         1993       210         .         .
end

replace father=0 if father==.
replace mother=0 if mother==.
gen parent = father + mother

bysort house: egen sum_p = sum(parent)
list
drop if sum_p == 0

(2) 在同一个household的同一个年份下  如 obs house  line year  inc   fa  mo              (问题1数据的部分截取)
                                                                     1。  211      1    1993  300   .    .
                                                                      2。   211    2    1993  200  1   1
           只对fa mo为缺失值的observation进行回归 但是回归时inc需用同一household下 相同年份的父母收入替代  如observation1中的300 需用 2中的200代替 也就是说用父母的收入做小孩收入的工具变量  fa或mo为1时表示此观测值为父母的   若父母的收入均存在 则用父亲的收入替代

怕没讲明白 再具体一些的意思如下:
      首先 我并不是对所有的观测值回归 而只是对fa 和 mo存在缺失值的观测值当做cross-section单独回归 如上述观测值1才满足条件 2因为fa mo 不为缺失值 所以在reg时希望将它排除在reg的命令之外
     其次 在对所选的的fa mo为缺失值的回归中 income数据并不是用个体自己的 而是用同一个household下相对应的父母收入做工具变量替代 比如1中的income300 需用2中的200替代 而且他们必须是同一年份下(如上述1993)的情况才可替代 问题在于我的数据是panel 会有很多不同的年份 不知道用什么语句才能让其选出在同一个household下的相同年份的个体及其父母数据 并只对个体进行回归 且回归的自变量收入需用相对应的父母收入代替?
挺多限制条件的 希望老师明白我意思了 非常非常感谢!
A: 这个问题,我认为你需要在仔细思考一番,把最核心的问题提出来,否则我无法抽出大块的时间从头到尾帮你解答。这已经超出了我在视频中介绍的内容。希望你能谅解。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群