2019/12/08
《No.7: p60-p66》《增强型分析-AI驱动的
数据分析、业务决策与案例实践》读书笔记
第3章 预测模型的新技术
   
3.4 模型最佳参数位置
    1)参数的设置要从”参数组合”的角度来作。由”验证数据”的表现来决定最佳参数组合。
    2)Gradient Boosting Tree算法的组合,会考虑”弱分类器的个数”、”learning rate”、”每次迭代抽样的比率”、”弱分类器决策树的深度”等。
    3)在scikit-learn支持参数组合的设置(支持Grid Search)
    4)进行Grid Search时,为避免过拟合,需与Cross Validation一起使用。
3.5 投票决定最终预测结果
    1)可透过构建多个不同算法的模型,通过投票机制来实现最终的预测。
    2)在scikit-learn中,投票器中各个模型的训练是在投票器的构造函数中完成。