全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
7035 6
2014-12-29
用R做随机森林,先用训练集建模,之后用测试集进行预测,为什么总是显示 all arguments must have the same length?代码如下
sub<-sample(1:nrow(dx),round(nrow(partd)/4))
x1.rf<-randomForest(X1T~.,data=dx,importance=T,subset=-sub)
pre1<-predict(x1.rf,data=dx,subset=sub)
另外,随机森林的结果里给出的confusion matrix是什么意思?和预测错误率有什么不同?多谢了!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-1-4 16:52:27
看一下是不是名字拼错了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-1-5 09:11:19
随机森林建模时每次会从所给数据中随机抽取样本建模然后用OBD数据进行预测,已经有交叉验证的作用了,所以可以不用再将总体样本区分测试集和训练集。confusion matrix可以理解成是预测的结果和实际结果的列联表,对角线上的是分类正确的个数,其余为错误分到相应类中的个数
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-1-5 16:00:35
东风未 发表于 2015-1-5 09:11
随机森林建模时每次会从所给数据中随机抽取样本建模然后用OBD数据进行预测,已经有交叉验证的作用了,所以可 ...
多谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-1-5 16:02:21
东风未 发表于 2015-1-5 09:11
随机森林建模时每次会从所给数据中随机抽取样本建模然后用OBD数据进行预测,已经有交叉验证的作用了,所以可 ...
但是老师给我们讲的是用训练集建模,用测试集进行测试。实际做了一下,训练集非常完美,测试集完全不行。您知道原因吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-1-6 18:12:27
这个就不知道了,找几篇随机森林的论文看看吧
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群