全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
16868 11
2014-04-03
悬赏 10 个论坛币 已解决

正在做随机森林的回归,因为是时间序列,当我用这个命令的时候

reg<-randomForest(y~.,data=mydata,importance=TRUE)  


出现这种错误


Error in randomForest.default(m, y, ...) :

  Can not handle categorical predictors with more than 32 categories.


请问各位高人该如何修正?多谢多谢了!



最佳答案

jgchen1966 查看完整内容

在你的数据集中有因子变量的因子水平数超过了32个,randomForest 无法处理,请用合并的方式,将因子水平数减至32个以下。。 如果你数据集中的各因子变量的因子水平数差异过大,RANDOMFOREST估计会有偏。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-4-3 06:45:31
在你的数据集中有因子变量的因子水平数超过了32个,randomForest 无法处理,请用合并的方式,将因子水平数减至32个以下。。
如果你数据集中的各因子变量的因子水平数差异过大,RANDOMFOREST估计会有偏。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-4-3 13:32:10
自己顶一下啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-4-4 18:45:24
可能是分类变量的类别过多,也可能你的分类变量未设成factor
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-4-17 15:17:03
你的分类太多了。你可以用random forest中的回归来做。也就是说,你的响应变量是一个数值,而不是factor.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-4-19 01:33:27
谢谢大家的回复!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群