全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
1516 7
2022-06-12
统计小白,有个疑惑,为什么可以从微观数据库(cgss cfps这样的)筛选符合某些特征的子样本(比如年龄16-34、或者地区是农村的、或者有迁移经历、或者有工作的等等)出来进行各种分析(比如回归等等)。

这些微观数据的抽样设计里,可能并没有这样的分层指标(譬如年龄、譬如工作经历、譬如工作状态),那么按照这样标准筛选出来的样本应该并不具有代表性呀,为什么很多论文都是这样筛选个案来做回归分析呢?

到底哪些指标能够用来筛选子样本,哪些指标不能用作筛选呢?

可能是我哪个地方没搞懂,还望有老师能帮我解惑,非常感谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-6-12 02:04:37
我也不太懂,同求
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-12 06:29:20
可以对筛选后的样本进行特征分析,看看样本量是否足够大,年龄、性别、学历等变量分布与主要调研样本差异是否显著。在保证样本具有代表性的前提下——有时你需要继续筛选——例如个别省份只有几个样本,就要剔除掉,然后进行分析,并在讨论部分指出这种样本筛选可能带来的影响。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-12 14:12:37
nieqiang110 发表于 2022-6-12 06:29
可以对筛选后的样本进行特征分析,看看样本量是否足够大,年龄、性别、学历等变量分布与主要调研样本差异是 ...
是不是这种事后的分布比较,只能提供部分的支持呀,比如年龄、性别、教育等分布可能很接近,但是感兴趣的变量或者用于筛选子样本的变量,其分布已经不同了?

看好多论文都没有做这样的说明,而是直接就筛了,总感觉是有问题的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-13 06:32:17
总体的无偏样本无法实现——随机抽样实现,就退而求其次——样本较大,且具有代表性
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-13 16:14:01
大样本代替总体 也有比较好的估计效果
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群