全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
10336 13
2017-12-12
R软件拿随机森林做一下变量筛选,数据15万,运行了一天都没出来,我不敢相信,我觉得有可能是哪里有问题,谁能帮我解答一下,谢谢!代码如下:

library(caret)
library(randomForest)
control <- rfeControl(functions=rfFuncs, method="cv")
rfe.train <- rfe(asyc[1:150000,1:10], asyc[1:150000,11], sizes=1:10, rfeControl=control)


R软件那20万数据做svm做预测,也是运行12小时也没有运行出结果,我觉得太不可思议了,谁能帮我找找问题!我觉得数据量并不是很大啊!
代码如下:
#采用svm进行预测
library(e1071)
traindata<-asyc[1:150000,c(1,2,4,5,6,8,9,10,11)]
svmfit<-svm(traindata[,9]~.,data=traindata,kernel="radial",type='eps-regression')
predict_svm<-predict(svmfit,data=asyc)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-12-12 09:20:05
变量选择的时候时先不要参数调优以及交叉验证,并且在变量选择的时候随机森林的 ntrees可以设置的小点。
使用formula时  一般不使用 df[,ncol]~.,要么传入公式要么传入 X 和 y
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-12-12 09:33:00
雾锁山城 发表于 2017-12-12 09:20
变量选择的时候时先不要参数调优以及交叉验证,并且在变量选择的时候随机森林的 ntrees可以设置的小点。
使 ...
ntree指的是什么,能详细说一下嘛
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-12-12 09:55:34
雾锁山城 发表于 2017-12-12 09:20
变量选择的时候时先不要参数调优以及交叉验证,并且在变量选择的时候随机森林的 ntrees可以设置的小点。
使 ...
我刚刚重新尝试一下,将df[,ncol]~.,换成了:
svmfit<-svm(traindata[,9]~traindata[,1]+traindata[,2]+traindata[,3]+traindata[,4]+traindata[,5]+traindata[,6]+traindata[,7]+traindata[,8],data=traindata,kernel="radial")
仍然很慢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-12-12 09:55:35
雾锁山城 发表于 2017-12-12 09:20
变量选择的时候时先不要参数调优以及交叉验证,并且在变量选择的时候随机森林的 ntrees可以设置的小点。
使 ...
我刚刚重新尝试一下,将df[,ncol]~.,换成了:
svmfit<-svm(traindata[,9]~traindata[,1]+traindata[,2]+traindata[,3]+traindata[,4]+traindata[,5]+traindata[,6]+traindata[,7]+traindata[,8],data=traindata,kernel="radial")
仍然很慢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-12-12 11:42:26
提示: 作者被禁止或删除 内容自动屏蔽
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群