全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
16905 6
2016-06-07
分类变量的缺失值怎么填补呀?
如果我把有缺失值的变量都去掉,数据就太少了。。但又不知道该如何填补分类变量的缺失值。。

(p.s. 这些数据是打算用来带进一个二分类logistic模型进行预测的。)

请问一下,这种情况该怎么办呀?

先谢谢了!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-6-7 01:56:45
如果你使用R,会有很多missing value inference的方法。

比如:https://cran.r-project.org/web/packages/FastImputation/index.html
https://cran.r-project.org/web/packages/available_packages_by_date.html
https://cran.r-project.org/web/packages/mitools/index.html
https://cran.r-project.org/web/packages/missForest/index.html
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-6-7 02:53:08
首先说说你需要在什么软件里填补缺失值。然后稍微解释一下为什么分类变量会有这么多缺失值呢?你想用这个分类变量做因变量来做logit回归的话填补太多的缺失值是不是有manipulate data的问题啊~ 稍微解释详细一点,大家比较好帮助你~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-6-7 11:11:04
雯 发表于 2016-6-7 02:53
首先说说你需要在什么软件里填补缺失值。然后稍微解释一下为什么分类变量会有这么多缺失值呢?你想用这个分 ...
谢谢你的回答,

我是在spss里填补缺失值,因为数据是问卷调查得到的数据,回答者没有填写的地方,都成了缺失数据。。

我用另外一组数据估计出了一个logi回归模型,然后想把现在这组缺失值很多的数据带进那个已估计出的模型来计算结果//
模型里的变量比较多,将近三分之二的数据都或多或少有空缺的地方。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-6-7 11:12:33
bbslover 发表于 2016-6-7 01:56
如果你使用R,会有很多missing value inference的方法。

比如:https://cran.r-project.org/web/package ...
谢谢你,

我用的是spss,,,搞不转R软件的说。。。T T
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-6-7 20:24:09
如果你会spass,你一定会喜欢R,建议学习一下R
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群