全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
957 1
2022-10-19




迭代(循环)次数可能的话超过40,选择所有的变量量甚至额外的辅助变量

详细的计算过程参考:Multiple Imputation by Chained Equations: What is it and how does it work?

占比较少: 10%以下进⾏行行单一值替换,如中位数,众数

在决策树中可以将缺失值处理融合到算法里:按⽐比重分配

这里的占比并不是固定的,例例如缺失值占比只有5%,仍可以用第二种⽅方法,主要依据业务逻辑和算法需求。



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-12-20 15:28:16
如果是大数量,空值只是一点点,可以删除;还可以平均值代替。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群