全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1301 1
2015-03-27
在sas建模过程中
验证数据集中的连续属性 缺失的话 我可以按照训练数据集中的中位数(如果训练数据集中是用中位数填缺的话)去填缺
那么验证数据集中的水平属性 缺失的话 我应该怎么填缺呢?

我在训练数据集中 考虑按照各个水平的分布情况 对缺失的水平属性进行填缺
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-3-29 15:54:36
sas 有三种imputation的方法:regression,mcmc和propensity score
推荐用mcmc,我跟我的导师聊imputation的问题时候,他跟我说过这么几句话:用平均值中位数去填充的做法一定要避免因为这普遍被认为是编造数据,Monte Carlo是比较推荐的方法,因为它毕竟保持了数据原有的distribution
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群