全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
17532 7
2014-03-31
悬赏 20 个论坛币 已解决
最近想做随机森林的分析,用R。看到一些例子都是一开始设置了随机种子。不清楚这种设置有没有什么范围,比如有的时候设置500,有的时候3000,数据结果是不一样的。请哪位高人给详细讲解一下,多谢啦。

最佳答案

lww1993 查看完整内容

1.http://blog.csdn.net/abcjennifer/article/details/8164315我基本是参考的这个文献。 2.http://www.autonlab.org/tutorials/dtree.html讲决策树的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-3-31 07:48:49
1.http://blog.csdn.net/abcjennifer/article/details/8164315我基本是参考的这个文献。
2.http://www.autonlab.org/tutorials/dtree.html讲决策树的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-3-31 16:45:06
同求~~~~~~~~~~~~~~~~~~~~~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-3-31 18:07:48
random seed的设置应该是在random forest中对变量进行random sampling用到的,就相当于产生随机数一样,设置一个随机种子,可以重复的产生相同的随机数。ps: 仅供参考
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-3-31 19:55:41
在做随机森林的时候,会有两个地方用到随机性。
一是用bootstrap选择n个样本点去生成classification and regression tree
二是选择node时,从所有属性中随机选取k个属性,在其中选取相应的最优属性做为node做分类或回归
上述步骤会生成一个CART.也就是一棵树。
R语言中默认是生成500棵树。
之所以选择随机数生成器,主要是为了结果的可重复性。
但是应该变化不大。
如果变化太大的话,我觉得可以多生成一些树,以降低随机性。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-4-1 05:35:03
谢谢楼上各位好心人的回复。lww1993,我已经将你的答案设置为最佳了,谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群