全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
2863 4
2020-04-20
R新手。。用R做随机森林,程序如下:
forest_hat <- randomForest(reformulate(vars, "kfr"), ntree=1000, mtry=11, maxnodes=100
                           ,importance=TRUE, do.trace=25, data=proj4[proj4$training==1,])
错误提示:Error in na.fail.default(list(kfr = c(0.388847082853317, 0.349385589361191,  :   missing values in object但是数据中training=1的,kfr变量是没有缺失值的。。求问这是怎么回事呢?该怎么处理呢?谢谢谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2020-4-20 16:09:53
在做kfr~vars回归之前,试试用na.omt()处理一下训练集,看看还报错不?
另外你这个vars有那么多吗?mtry需要设到11吗?先用tuneRF()优化一下mtry看看。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-4-20 16:23:30
以前遇到过类似的问题,清洗数据后仍然报错,后来用as.numeric()定义了数据类型,就解决了。不过你这个kfr应该不是类型错误
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-4-20 23:00:38
llb_321 发表于 2020-4-20 16:09
在做kfr~vars回归之前,试试用na.omt()处理一下训练集,看看还报错不?
另外你这个vars有那么多吗?mtry需 ...
嗯vars有100多个。。最后我在后面加了na.action=na.exclude就可以了。但我还是不是很明白为什么会说kfr有缺失值
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-4-21 09:20:07
R读入原数据时会有我们意想不到的处理,比如数据如果看起来是double但实际是character的,R会自作主张把数据弄成factor,于是意外出现了。所以使用数据前清洗一下会免除很多麻烦。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群