全部版块 我的主页
论坛 计量经济学与统计论坛 五区 数据交流中心
9200 12
2020-09-28
朋友们好,想请教一下关于CHFS权重的问题。我想用CHFS13 15 17三年数据中的受访人样本做成面板数据,三年都有提供权重,但是17年有分家户和个人权重。
问题:因为我要的数据有家户信息,比如家庭总收入,也有受访人个人信息,结合13 15的数据,那么17应该也要选用家户权重吧?

还有一个有点愚钝的问题就是:权重是在描述性统计和回归时都要用吧?

谢谢~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2020-11-12 12:55:42
同求回答
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-1-18 08:59:26
同求!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-1-28 14:11:37
同求回答,请问楼主解决问题了吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-1-28 14:15:37
CHFS的官方说明是:
在我们的抽样设计下,由于每户家庭被抽中的概率不同,因此每户家庭代表的中国家庭数量也就不同。在推断总体的时候,需要通过权重的调整来真实准确地反映每户样本家庭代表的家庭数量,以获得对总体的正确推断。中国家庭金融调查的所有计算结果都经过抽样权重的调整。在 master 数据集中含有权重变量:“swgt_h”代表家庭权重,“swgt_p”代表个人权重。

其抽样权重的计算方法如下:根据每阶段的抽样分别计算出调查市县被抽中的概率 p1、调查社区(村)在所属区县被抽中的概率 p2 、以及调查样本在所属社区(村)被抽中的概率p3,分别计算出三阶段的抽样权重 w1=1/p1、w2=1/p2、w3=1/p3,最后得到该样本的抽样权重为swgt_h=w1?w2?w3 。

考虑到样本在性别、年龄、地区等属性上与全国人口偏差较大,因此还会进行分组调整,基于国家统计局人口结构和总数,设定每个组相应的调整系数值。家庭权重(swgt_h)为没有经过调整的权重,个人权重(swgt_p)等于家庭权重乘以调整系数。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-2-9 17:36:59
thanks for sharing
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群