全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
3346 5
2017-08-02
在进行分析时,发现某个重要的分类变量存在大量的缺失值,能否将缺失值赋值为单独的一类纳入分析呢?
比如,收入:1=below 5000; 2=5000 or above; 3=unknown
并不想分析这个变量,只是需要进行调整,如果删除含缺失值的case,损失的样本量有点多。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-8-3 07:37:06
Ryancheer 发表于 2017-8-2 21:24
在进行分析时,发现某个重要的分类变量存在大量的缺失值,能否将缺失值赋值为单独的一类纳入分析呢?
比如 ...
软件这样操作是能做出来的。然而个人觉得实际意义不大,因为不好解释。能代表缺失值的东西太多太多了,是一个黑箱。所以,我的建议是如果觉得缺失值太多,删除后样本量缺失严重,建议先把缺失值补齐,然后再做回归。祝好运~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-8-5 10:05:19
xddlovejiao1314 发表于 2017-8-3 07:37
软件这样操作是能做出来的。然而个人觉得实际意义不大,因为不好解释。能代表缺失值的东西太多太多了,是 ...
了解了,谢谢您啦!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-8-9 10:12:35
xddlovejiao1314 发表于 2017-8-3 07:37
软件这样操作是能做出来的。然而个人觉得实际意义不大,因为不好解释。能代表缺失值的东西太多太多了,是 ...
"能代表缺失值的东西太多太多了,是一个黑箱。"
非常同意!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-8-9 11:09:12
缺失20%以下可以给缺失的case一个值硬做。如果缺失40%以上,可以对比一下缺失和不缺失的人群各有什么特点,弄不好会有有意思的发现。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-18 19:00:34
xddlovejiao1314 发表于 2017-8-3 07:37
软件这样操作是能做出来的。然而个人觉得实际意义不大,因为不好解释。能代表缺失值的东西太多太多了,是 ...
你好,我个人也会这样处理数据,目的是为了留住观测对象,比如题主的2分类,unknown可以作为赋值为9,如果计算OR值,1作为reference的话,不去对9:1的情况进行说明,这样可以吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群