全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
5118 4
2015-10-24
我要用随机森林回归,预测负荷。程序如下,
ntdata1<-read.csv('C:/Users/*****ingting/Desktop/ntdata1.csv',header=TRUE)
ntdata2<-read.csv('C:/Users/*****ingting/Desktop/ntdata2.csv',header=TRUE)
library(randomForest)
ranfor<-randomForest(Load~.,data=ntdata1,ntree=1000,mtry=2,importance=TRUE)
print(ranfor)
pred<-predict(ranfor,ntdata2)
print(pred)

ntdata1,即训练样本表头是
Time StampNameLoadMax TempMin TempMax Wet BulbMin Wet Bulb
1NORTH784.15778511-79-7
2NORTH840.695986-7-14-7-14
3NORTH847.355451-4-16-5-16
4NORTH807.75612219-1716-17
5NORTH753.44318931173015
ntdata2,也即测试样本表头是
Time StampNameLoadMax TempMin TempMax Wet BulbMin Wet Bulb
1North751.879794537163515
2North739.91666737273425
3North754.00724142710249
4North767.0924658278227
。但是运行程序后出现
> pred<-predict(ranfor,ntdata2)Error in predict.randomForest(ranfor, ntdata2) :
  New factor levels not present in the training data
求大神指导,我到底哪个地方错了。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-10-24 13:16:18
好高深。。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-12-7 16:56:03
遇到同样错误,不知所措
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-12-8 21:38:12
可能的原因:NORTH 和 North,R语言大小写敏感,自然Trainset中的Name被识别成了其他的factor levels。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-12-9 10:40:37
错在“Load~.”, 因为基本的R 问题,就不讲了!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群