我现在在用CFPS2012-2020五年的家庭经济问卷(famecon)数据挑选变量后预计合成一份家庭面板,其中每一年家庭经济问卷(famecon)提供的的权数变量如下:(1)2012年:
fswt_natcs12——家庭横截面权数:全国总样本
fswt_rescs12——家庭横截面权数:全国再抽样样本
fswt_natpn1012——家庭面板权数:全国总样本
fswt_respn1012——家庭面板权数:全国再抽样样本
(2)2014年:
fswt_natcs16——CFPS2014家庭横截面权数:全国总样本
fswt_rescs16——CFPS2014家庭横截面权数:全国再抽样样本
fswt_natpn1016——CFPS2014家庭面板权数:全国总样本
fswt_respn1016——CFPS2014家庭面板权数:全国再抽样样本
(3)2016年:
fswt_natcs16——CFPS2016家庭横截面权数:全国总样本
fswt_rescs16——CFPS2016家庭横截面权数:全国再抽样样本
fswt_natpn1016——CFPS2016家庭面板权数:全国总样本
fswt_respn1016——CFPS2016家庭面板权数:全国再抽样样本
(4)2018:
fswt_natcs18n——CFPS2018家庭横截面权数(标准化)
(5)2020:
fswt_natcs20n——CFPS2020家庭横截面权数(标准化)-无回答权数
fswtps_natcs20n——CFPS2020家庭横截面权数(标准化)-事后分层权数
看了CFPS数据的用户手册,和网上好多官方回复疑问,大概搞明白的是,家庭横截面权数是用于单个年份的分析,家庭面板权数是用于追踪数据的分析,因此初步断定我的数据适合于面板权数。但是面板权数(基于资料的表述我认为它等同于追踪权数)是只对基因成员有值,我最终合并成的一定是个混合面板数据,且我的数据还不包含2010年,那么我该怎么用这些权数呢?
基于搜集到的资料,我想到的使用方案有两种:
1、因为是追踪数据所以只使用最后一年的面板权数;
2、使用每一年同样的面板数据,也就是fswt_natpn1012、fswt_natpn1014、fswt_natpn1016。
以上两个方案的共同问题是CFPS从2018年开始就不提供家庭面板数据了,这就造成这些权数在我的5年内不可比。
所以说还是不明白权数应该怎么用,希望有同样用过这个数据的友友看到之后给点解答,先在此表示感谢。另外附上我开头说过的搜集到的资料吧。