全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
10723 7
2018-07-18
最近在处理数据 里边的a5(与户主的关系)有许多缺失值。

但是这些缺失值在之前的调查年数据中是存在的  因此可以再重新赋值。

但是由于存在户主更换的问题  导致不可以简单地sort 再 carryforward

因此我想把数据分为  没有更换过户主 和 更换过户主两类

1.png

比如这张图  这家人的户主进行了更换

根据a5 和 wave 可以看出在2015年户主变成了孙辈

而问卷中外祖父母在a5中没有对应的值 所以导致 2015 年 a5为空值

2.png

再看这张图 由于户主没有更换 因此可以简单地赋值

我的问题是: 如何根据hhid idind line a5 来生成一个识别变量 识别出来他们有没有更换户主呢?

我个人的思路是如果a5在几个wave中的数值相同或为空值则这个新变量的值为0
                      如果更换了户主 即全家人的a5在不同的wave里有变化 那么这个新变量的值为1
印象当中是有根据重复值来确定频数的命令吧?
bys hhid idind a5: gen var1=_n ??? 我知道这个不对 所以过来求助。

当然也有可能我想得过于复杂 如果有更简单识别的方法也请教教我 感谢感谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-7-18 16:32:35
为何没有大神来回答呀 是不是我没有把问题说清楚??我再重新组织一边语言

我在处理数据的时候 发现a5有很多缺失值 (a5是与户主的关系)

缺失的原因分为两种
一种是户主更换了 所以有缺失值
另一种是户主没有更换 缺失原因不清楚 但是以前的wave中有对应的值 可以直接赋过来
上面两张图中 hhid=111102010 的是更换过户主的情况 很明显排序后a5乱成一团
                    hhid=111203018 的是没有更换过户主的情况 a5就很整齐 只需要把2015年的缺失值根据2011来重新赋值即可。

因此我想创建一个识别变量 来识别这家人有没有更换过户主

请问要如何写这条命令?


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-7-18 16:49:27
再补充一下 数据就是CHNS的数据
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-7-18 17:16:11
我实在看不懂你的问题!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-7-19 17:42:42
黃河泉 发表于 2018-7-18 17:16
我实在看不懂你的问题!
哎 那我再重新组织一下语言
我就是要识别这家人有没有更换过户主。
因为生老病死的关系 户主是会变化的 所以我要把更换过户主的家庭识别出来

昨天我的处理思路有点复杂了

今天的新思路是
按照家庭编号(hhid) 与户主的关系(a5) 年份(wave) 三个变量进行排序  
再根据可确定唯一性的个人编号(idind)来看看idind是否产生了变化
如果没有产生变化 那么应该是这样的
hhid    inind   a5   wave
111      001    0     2011
111      001    0     2015
111     002     1     2011
111     002     1     2015
111     003     2     2011
111     003     2     2015
这里排序后 对应不同的年份 idind没变

如果发生了变化 (假设003变成了户主)那么就应该是
hhid    idind   a5   wave
111      001    0     2011
111      003    0     2015
也就是排序后 idind 变了

那么问题来了 能够识别排序后的idind 有没有变化 就可以识别这家人有没有更换户主

所以 老师 命令要怎么写? bys hhid a5 wave: gen ??????
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-7-19 17:51:38
龙真 发表于 2018-7-19 17:42
哎 那我再重新组织一下语言
我就是要识别这家人有没有更换过户主。
因为生老病死的关系 户主是会变化的 ...
1. 看起來似乎比較清楚 (只有兩期吧?) 2. 你若要问程序,永远附上资料;若要附上资料,永远用 dataex 印出资料;先 ssc install dataex (并见说明),将原始 Stata 资料中具有”代表性”的一部分资料列出,以供有意回答者实验之用,并能提供具体操作指令。并请参考 http://www.jianshu.com/p/9870080fe769,  https://bbs.pinggu.org/thread-5048204-1-1.html, 与 https://bbs.pinggu.org/thread-5917273-1-1.html
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群