利用R自带的iris数据进行random forest测试,但是random forest运算后显示的混淆矩阵结果和用predict函数基于源数据给出的混淆矩阵的结果不一致。两相比较,基于predict函数预测的混淆矩阵结果非常完美,这个是什么原因?
代码如下:
modfit<- randomForest(Species~., data = iris)
modfit
table(predict(modfit, iris), iris$Species)
modfit显示的confusion matrix如下:
setosa versicolor virginica class.error
setosa 50 0 0 0.00
versicolor 0 47 3 0.06
virginica 0 4 46 0.08
table(predict(modfit, iris), iris$Species)显示的confusion matrix如下:
train.rf setosa versicolor virginica
setosa 50 0 0
versicolor 0 50 0
virginica 0 0 50