本人最近使用R语言中的randomforest包进行回归分析,使用以下算法处理数据:
##Regression:## data(airquality)
set.seed(20)
ozone.rf <- randomForest(Y ~ ., data=training,mtry=3,
importance=TRUE,na.action=na.omit)
print(ozone.rf)
## Show "importance" of variables:higher value mean more important:
round(importance(ozone.rf), 2)
最后得到的分析结果为:
Mean of squared residuals: 3402.69
% Var explained: 20.87
解释20%的变量,显然结果是不好的,请教各位大神如何提高该方法的精度?(本人使用的数据是气候类型的,样本数量为300个左右。)