请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
qiu435 发表于 2017-10-25 11:03 样本容量太小,经过抽样后构建的训练集已已经无法反映原始数据的信息。最后的办法就是增加样本容量。如果无 ...
若の渡2.0 发表于 2017-10-25 11:15 谢谢您!样本少造成随机森林分类准确率无法随着树的增多而提高。我不明白为什么效果会低于人为瞎选呢(50 ...
jameschin007 发表于 2017-10-25 12:07 最好看一下这些变量的重要度。我猜测可能很多变量对预测起不到作用。 那么很多树在选取这些变量时,效果 ...
qiu435 发表于 2017-10-25 13:54 含有重要度的低的变量并不会影响结果,但是对于每个节点上使用多少个变量,即mtry参数需要通过逐次计算进 ...
qiu435 发表于 2017-10-25 13:50 随机森林给出的预测率并不是准确率,而是OBB误差率,即使用随机抽样剩下的袋外数据进行预测,用于评估模型 ...
若の渡2.0 发表于 2017-10-30 09:49 我将样本重复3、4次后,误差率确实小了很多,甚至达到了5%之内,但是随着带来了过拟合情况。也就是换了个 ...