全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
26886 23
2010-03-09
请教各位高手:

R语言中随机森林(randomForest)程序包里,怎么设置是分类,怎么设置就是回归呢?

在randomForest程序包的解释中,关于参数y的介绍如下:
y A response vector. If a factor, classification is assumed, otherwise regression is assumed. If omitted, randomForest will run in unsupervised mode
难道如果数据不是因子就无法进行分类处理吗,我分析的y为风险等级,分为五等,这个算是factor么?

进行这些操作主要是想对数据进行异常点删除,但是折腾了很久都弄不出来。
谢谢啦,本文是超级菜鸟,边学边做,望各位赐教!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-3-9 19:33:36
也想了解下哎。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-3-9 20:47:48
注意一下你的数据型态,
Data:iris 就是classification (Species)
Data: airquality就是regression (Ozone)

data(iris)
iris
iris.rf <- randomForest(Species ~ ., data=iris)
iris.rf
Call:
randomForest(formula = Species ~ ., data = iris)
          Type of random forest: classification

data(airquality)
airquality
ozone.rf <- randomForest(Ozone ~ ., data=airquality, na.action=na.omit)
ozone.rf
Call:
randomForest(formula = Ozone ~ ., data = airquality, na.action = na.omit)
               Type of random forest: regression
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-3-9 20:52:10
本人也在学习R,菜鸟级别的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-3-10 20:16:18
good !!
Thanks for your exemple!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-5-17 16:42:00
要设置response variable的类型,可以根据as.factor或as.numeric来设置,前者设置成因子类型,randomforest自动识别为分类;后者设置成数值类型,randomforest自动识别为回归。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群