全部版块 我的主页
论坛 计量经济学与统计论坛 五区 数据交流中心 数据求助
770 8
2023-10-24
CFPS中,qc401(过去12个月是否因病住院)这一变量的所有回答,包括缺失、不适用、拒绝回答等各种情况,加在一起的样本量共25082个,而总样本量共28530个,查看原始数据,发现这一变量的取值中有.,count if qc401==.得到结果是3448,这是缺失值吗?但是在变量取值的标签中已经定义过缺失情况的取值了,具体如下:

. label list qc401

qc401:

        -10 无法判断

         -9 缺失

         -8 不适用

         -2 拒绝回答

         -1 不知道

          0 否

          1 是

         79 情况不适用

. tab qc401

   过去12个 |

     月是否 |

     因病住 |

        院 |     Freq.     Percent        Cum.

------------+-----------------------------------

      缺失 |        17        0.07        0.07

     不适用 |        390        1.55        1.62

     不知道 |          2        0.01        1.63

        否 |    22,365       89.17       90.80

        是 |     2,308        9.20      100.00

------------+-----------------------------------

     Total |     25,082      100.00

缺失情况qc401的取值不就是-9吗?那么这3448个qc401==.的样本又代表什么意思呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2023-10-28 12:12:30
第二个问题:2018年及以前年度的CFPS家庭经济库的数据中,关于收入的变量有fincome1和fincome2,都是家庭收入指标,区别是fincome2是与2010年可比的家庭收入,但是在CFPS2020的家庭经济库中,只有fincome1的相关变量,没有fincome2的相关变量了,为什么?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-10-30 21:32:53
这个应该也是缺失值吧,我是按照缺失值直接处理了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-11-1 11:35:33
第三个问题:在合并家庭经济库和个人库的过程中,发现同一家庭变量在两库中的取值可能存在冲突,比如家庭规模变量fml_count(家庭成员人数),以fid20的样本为例,在家庭经济库中,list fml_count if fid20==110024,fml_count=2,在个人库中,list fml_count if fid20==110024,fml_count=-8(不适用)。再如fid20=210386的样本,在家庭经济库中,list fml_count if fid20==210386,fml_count=3,在个人库中,tab fml_count if fid20==210386,fml_count取值有两,分别为3和-8(不适用),这是为什么?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-11-1 12:16:50
第四个问题:接着第三个问题,我使用merge语句以及update replace语句合并家庭经济库和个人库,命令如下:
use "CFPS2020\cfps2020famecon_202306.dta",clear
merge 1:m fid20 using "CFPS2020\cfps2020person_202306", update replace
这样会把所有个人库中的变量取值替代和更新原有家庭经济库中相同变量的取值,现在如果我想在此基础上,仅让变量家庭规模fml_count保持来自主数据库,即家庭经济库的取值,应该如何改写命令?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-11-1 14:47:16
陈罗炜 发表于 2023-11-1 11:35
第三个问题:在合并家庭经济库和个人库的过程中,发现同一家庭变量在两库中的取值可能存在冲突,比如家庭规 ...
已找到答案:“我们计算人均家庭纯收入时采用了fml2016_count是因为现场受访者是根据fml2016_count中所包含的人员来回答经济问卷的”,因此应该选用家庭经济库中家庭规模变量fml_count。
详见:CFPS小课堂 | 数据使用 Q&A (2020 : 4)
https://www.isss.pku.edu.cn/cfps/cjwt/jtgxk/1356825.htm?eqid=9f16ad080001880200000005646ed1d2
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群