全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
4258 4
2014-06-22
Call:
randomForest(formula = keyunliang ~ ., data = bjdata, importance = TRUE)
               Type of random forest: regression
                     Number of trees: 500
No. of variables tried at each split: 3

          Mean of squared residuals: 14369293
                    % Var explained: 96.07
得到这个结果  我感觉好像是过拟合了
数据 23组数据 每组数据10个参数


对训练数据进行【-1,1】归一化后 结果
Call:
randomForest(formula = keyunliang ~ ., data = bjdata, ntree = 500,      mtry = 2, importance = TRUE)
               Type of random forest: regression
                     Number of trees: 500
No. of variables tried at each split: 2

          Mean of squared residuals: 1.420348e-13
                    % Var explained: 96.81

残差平方和大的原因是因为我的输入数据 都是好几万的那种 甚至有上亿的 所以残差平方和归一化前很大
不过归一化前后 varImpPlot(reg.rf)这个函数 的输出结果不同 不知道 该如何取舍  
我感觉我这90%的解释率 有点太高了 可能是过拟合了~

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-6-23 11:14:25
你用的是随机 回归啊,怎么才用分类的呢??求解释

随机森里 对归一不归一  没有太大的要求吧。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-6-24 08:50:31
wanlin000 发表于 2014-6-23 11:14
你用的是随机 回归啊,怎么才用分类的呢??求解释

随机森里 对归一不归一  没有太大的要求吧。
但是为什么归一化后 得到的结果不同呢?而且单位不同的话 貌似应该也会不同的~结果
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-6-25 09:26:05
恙日 发表于 2014-6-24 08:50
但是为什么归一化后 得到的结果不同呢?而且单位不同的话 貌似应该也会不同的~结果
我做的时候差距甚微啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-6-25 09:54:15
wanlin000 发表于 2014-6-25 09:26
我做的时候差距甚微啊
大神您加我qq吧~510741526~或者我加您qq也行~这样交流太慢的说~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群