全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
5745 6
2023-02-12
使用CFPS成人库作为master文件,家庭库(家庭经济库)作为using文件,使用家庭编码fid作为合并指标时,出现来自using文件的不匹配情况,为什么会这样?家庭库(家庭经济库)的家庭编码fid不应该全部来自于成人库中已经有的家庭编码吗?看了使用手册没发现关于这个问题的解答。希望各位老师帮忙看看,是我的命令使用错误,还是CFPS数据本身就是这样?
备注:已经查看过变量重复情况,成人库中,fid不唯一;家庭库(家庭经济库)中,当年的fid唯一。


CFPS2010:
代码:
use $data2010\cfps2010adult_201906.dta, clear
merge m:1 fid using $data2010\cfps2010famecon_201906.dta
结果:
    Result                           # of obs.
    -----------------------------------------
    not matched                           369
        from master                       116  (_merge==1)
        from using                        253  (_merge==2)

    matched                            33,484  (_merge==3)
    -----------------------------------------



CFPS2012:
代码:
use $data2012\cfps2012adult_201906.dta, clear
merge m:1 fid12 using $data2012\cfps2012famecon_201906
结果:
    Result                           # of obs.
    -----------------------------------------
    not matched                           202
        from master                       105  (_merge==1)
        from using                         97  (_merge==2)

    matched                            35,614  (_merge==3)
    -----------------------------------------


CFPS2014:
代码:
use $data2014\cfps2014adult_201906.dta, clear
merge m:1 fid14 using $data2014\cfps2014famecon_201906.dta
结果:
    Result                           # of obs.
    -----------------------------------------
    not matched                           451
        from master                       282  (_merge==1)
        from using                        169  (_merge==2)

    matched                            36,865  (_merge==3)
    -----------------------------------------









二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2023-2-12 02:03:53
不知道为什么发出来以后代码格式有误,更正一下:
CFPS2010代码:
(1)use $data2010\cfps2010adult_201906.dta, clear
(2)merge m:1 fid using $data2010\cfps2010famecon_201906.dta

CFPS2012代码:
(1)use $data2012\cfps2012adult_201906.dta, clear
(2)merge m:1 fid12 using $data2012\cfps2012famecon_201906

CFPS2014代码:
(1)use $data2014\cfps2014adult_201906.dta, clear
(2)merge m:1 fid14 using $data2014\cfps2014famecon_201906.dta
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-2-13 18:51:08
点个赞,谢谢分享!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-4-8 14:36:56
谢谢分享,很有用!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-10-17 15:51:36
根据CFPS下载官网上,用户会“数据培训”系列视频的说明,用变量fidXX对家庭经济库和个人库(成人库)进行匹配后,确实会出现无法匹配(Not matched)的数据,也就是说,这两个库并不是包含关系,而是交叉关系,对此的解释是:家庭成员问卷完访后,才会产生其他类型问卷(既家庭经济问卷、个人问卷等)。其他类型问卷是否完访是独立的(完访顺序是独立的,是否完访也是独立的)。
举例说明:从流程上来说,是先提问家庭经济问卷,再提问个人问卷,因此不应该出现fid18出现在个人库中,但没有出现在家庭经济库中的情况。但CFPS用户会“数据培训”系列视频  (Chinese Version)中好像有提到,进行调查的时候,不一定按照特定的顺序进行,需要调查员通过自己的判断灵活决定,比如时间紧张的情况下,已经无法完访家庭经济库,但家庭经济库已经完成了“家户收入”整个大模块的数据采集,这时调查员也可能直接跳到个人问卷部分,使个人问卷有时间可以完成“上学确认”、“教育史”、“婚姻” 模块,从而达到发布的标准。
由此,也可以合理猜测,某些情况下,可能是先完成了个人问卷,家庭经济问卷则没有完访问,因此出现了有个人问卷fid,但没有家庭经济问卷fid的情况。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-11-2 17:17:13
陈罗炜 发表于 2023-10-17 15:51
根据CFPS下载官网上,用户会“数据培训”系列视频的说明,用变量fidXX对家庭经济库和个人库(成人库)进行 ...
感謝!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群