我目前建立了一个randomForest,由于给定的测试集没有响应变量的信息,于是把测试集一分为二,形成新的训练集和测试集,然后现在比赛要求给出给定测试集的各样本的违约概率,我把该测试集读入R预测后,一直在报错,提示:
> prediction=predict(rf.flag,prete,type="prob")
Error in predict.randomForest(rf.flag, prete, type = "prob") :
New factor levels not present in the training data