关于从微观数据中筛选子样本来进行分析的疑惑 - Stata专版 - 经管之家

› 论坛 › 计量经济学与统计论坛五区 › 计量经济学与统计软件 › Stata专版

关于从微观数据中筛选子样本来进行分析的疑惑

1653

7

收藏 2022-06-12

统计小白，有个疑惑，为什么可以从微观数据库（cgss cfps这样的）筛选符合某些特征的子样本（比如年龄16-34、或者地区是农村的、或者有迁移经历、或者有工作的等等）出来进行各种分析（比如回归等等）。

这些微观数据的抽样设计里，可能并没有这样的分层指标（譬如年龄、譬如工作经历、譬如工作状态），那么按照这样标准筛选出来的样本应该并不具有代表性呀，为什么很多论文都是这样筛选个案来做回归分析呢？

到底哪些指标能够用来筛选子样本，哪些指标不能用作筛选呢？

可能是我哪个地方没搞懂，还望有老师能帮我解惑，非常感谢。

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

2022-6-12 02:04:37

我也不太懂，同求

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-6-12 06:29:20

可以对筛选后的样本进行特征分析，看看样本量是否足够大，年龄、性别、学历等变量分布与主要调研样本差异是否显著。在保证样本具有代表性的前提下——有时你需要继续筛选——例如个别省份只有几个样本，就要剔除掉，然后进行分析，并在讨论部分指出这种样本筛选可能带来的影响。

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-6-12 14:12:37

nieqiang110 发表于 2022-6-12 06:29
可以对筛选后的样本进行特征分析，看看样本量是否足够大，年龄、性别、学历等变量分布与主要调研样本差异是 ...

是不是这种事后的分布比较，只能提供部分的支持呀，比如年龄、性别、教育等分布可能很接近，但是感兴趣的变量或者用于筛选子样本的变量，其分布已经不同了？

看好多论文都没有做这样的说明，而是直接就筛了，总感觉是有问题的。

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-6-13 06:32:17

总体的无偏样本无法实现——随机抽样实现，就退而求其次——样本较大，且具有代表性

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-6-13 16:14:01

大样本代替总体也有比较好的估计效果

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

相关推荐

栏目导航

热门文章

推荐文章

扫码加好友，拉您进群

各岗位、行业、专业交流群