全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 悬赏大厅
797 1
2024-07-08
悬赏 1 个论坛币 未解决
CFPS 文本编码——专业 为什么那么多不适用,在逻辑图里面,其本上所有16岁以上群体(包括初中及以上群体)都调查了专业、学科类型,并且通过观察数据发现调查专业的受访者占比至少要到一半,而问卷中有效数值只占到2%
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2024-7-9 09:01:36
CFPS(中国家庭追踪调查)文本编码中的“不适用”或缺失值比例高可能是由以下几个原因导致的:

1. **样本选择偏差**:并非所有被调查者都有正式教育背景或者专业。例如,对于年纪较大的受访者、未接受过高等教育的人群、以及初中以下学历的人群来说,“专业”这一信息可能确实不适用。

2. **数据清理规则**:在处理问卷数据时,为了保证数据质量,研究团队可能会设定一些过滤规则。比如,如果某项调查问题与受访者的当前状态不符(例如问一个未上过大学的受访者他的大学专业),那么这项回答将被标记为“不适用”或缺失值。

3. **回忆偏差**:对于那些有高等教育背景但已经毕业多年的受访者来说,他们可能记不清具体的专业名称或者分类。这种情况下,研究者可能会选择记录为“不适用”而非错误的信息。

4. **问卷设计与实施过程中的误差**:在调查过程中可能出现的误解、疏忽或数据录入错误也可能导致部分有效信息被标记为“不适用”。

5. **保护隐私**:在某些情况下,受访者可能不愿意透露自己的专业信息。研究者出于尊重和保护受访者的隐私权,可能会将这部分信息处理为缺失。

6. **数据编码规则**:CFPS的数据编码规则中,“不适用”或缺失值的定义可能较为严格,即使是一些看似有教育背景的受访者也可能因为种种原因被标记为“不适用”。

在使用这些数据时,研究人员需要理解上述潜在的原因,并根据研究目的决定如何处理这些“不适用”的信息。例如,通过构建预测模型来推测缺失的专业信息、对样本进行分层分析以排除特定群体的影响等。

总之,“专业”编码中大量出现的“不适用”并不是一个简单的数据错误问题,它反映出了调查设计与实施、数据清理规则和受访者的复杂性等多个层面的因素。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群