R随机森林，training变量没有缺失值，却提示有缺失值 - 经管之家

› 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › R语言论坛

R随机森林，training变量没有缺失值，却提示有缺失值

3042

4

收藏 2020-04-20

R新手。。用R做随机森林，程序如下：
forest_hat <- randomForest(reformulate(vars, "kfr"), ntree=1000, mtry=11, maxnodes=100
,importance=TRUE, do.trace=25, data=proj4[proj4$training==1,])
错误提示：Error in na.fail.default(list(kfr = c(0.388847082853317, 0.349385589361191, : missing values in object但是数据中training=1的，kfr变量是没有缺失值的。。求问这是怎么回事呢？该怎么处理呢？谢谢谢谢！

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

2020-4-20 16:09:53

在做kfr~vars回归之前，试试用na.omt()处理一下训练集，看看还报错不？
另外你这个vars有那么多吗？mtry需要设到11吗？先用tuneRF()优化一下mtry看看。

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2020-4-20 16:23:30

以前遇到过类似的问题，清洗数据后仍然报错，后来用as.numeric()定义了数据类型，就解决了。不过你这个kfr应该不是类型错误

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2020-4-20 23:00:38

llb_321 发表于 2020-4-20 16:09
在做kfr~vars回归之前，试试用na.omt()处理一下训练集，看看还报错不？
另外你这个vars有那么多吗？mtry需 ...

嗯vars有100多个。。最后我在后面加了na.action=na.exclude就可以了。但我还是不是很明白为什么会说kfr有缺失值

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2020-4-21 09:20:07

R读入原数据时会有我们意想不到的处理，比如数据如果看起来是double但实际是character的，R会自作主张把数据弄成factor，于是意外出现了。所以使用数据前清洗一下会免除很多麻烦。

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

相关推荐

栏目导航

热门文章

推荐文章

扫码加好友，拉您进群

各岗位、行业、专业交流群