jgchen1966 发表于 2015-7-30 17:07 
从一次randomForest 运行得到这两变量重要指标,只能作为“定性”探索变量用,无法作为定量决策“变量取舍 ...
请问一下,这里的定性探索是指这些importance能够给出一个参考性的建议,但是并不是对特征严格的排序,我理解得对吗?
试过Boruta,发现(应该是样本太少)结果非常不理想,几千个特征只留下十几个,完全没有办法继续做了。
最后发现,最成功的是直接根据词频人工选出一些特征来,但因为要做论文,感觉说人工筛选站不住脚……请问您有什么推荐的应该去了解的知识吗?找了好多,有点捉急。
谢谢!