全部版块 我的主页
论坛 计量经济学与统计论坛 五区 数据交流中心 调查问卷专版
1999 1
2020-03-30
收集完的数据首先要做的是数据的清理,不完成数据的清理直接做分析是会出现问题的。
1.清理无效数据
       a) 根据题目设置的测谎题或者填空题来判断是否是乱答;b) 根据作答时间判断是否乱答;结合各个条件判断是否无效,并清除无效数据。
2.缺失值的处理
      如果存在缺失值,可以用平均值、趋势值等方式代替。
3.逻辑判断
      查看是否有逻辑不顺的题目,比如年龄-工作年限>18,等,需要符合实际。
4.填空题的清理
    数值型的填空题需要清理非数值的部分,文本型的填空题需要清理乱填乱答的部分。

有新的再补充···
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2020-3-30 21:22:18
谢谢分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群