jmq19950824 发表于 2018-9-30 12:24 
多谢!我基本是用的caret进行机器学习,然后用doParallel并行加速,主要还是想再快一点。。。
xgboost,lightgbm(这个速度确实很快,公布时曾经很惊艳!但似乎停止开发了……)
机器学习的算法在速度上差异很大,甚至一个算法的某个参数微调一下,速度就差不少,但结果却差不多。
所以经常需要花费很多时间调参,因为要面对的数据集千差万别。
我的经验是对于量稍大的数据集,先抽样个小子集,试用几个候选最佳方法后,再拿原始数据集跑跑……要不有时候动辄跑一次交叉验证就得十几分钟……