求解答random forest两种方法下得出的混淆矩阵(confusion matrix)不一致的问题

6301

收藏 2015-12-24

利用R自带的iris数据进行random forest测试，但是random forest运算后显示的混淆矩阵结果和用predict函数基于源数据给出的混淆矩阵的结果不一致。两相比较，基于predict函数预测的混淆矩阵结果非常完美，这个是什么原因？

代码如下:
modfit<- randomForest(Species~., data = iris)
modfit
table(predict(modfit, iris), iris$Species)

modfit显示的confusion matrix如下:
         setosa versicolor virginica class.error
setosa       50       0       0       0.00
versicolor    0       47       3       0.06
virginica    0       4       46       0.08

table(predict(modfit, iris), iris$Species)显示的confusion matrix如下:
train.rf    setosa versicolor virginica
  setosa       50       0       0
  versicolor    0       50       0
  virginica    0       0       50

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

zxt0830

2015-12-25 02:04:28

是不是要设置seed？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群