1 什么叫全局最优?如何达到全局最优?
全局最优:经过组合形成的,整体来说分类效果最好的模型
如何达到全局最优:全局选取最优的路径
2 什么叫贪心策略?如何通过贪心策略达到次最优?
贪心策略:通过局部的最优来达到我们相信是最接近全局最优的结果。
如何通过贪心策略达到次最优:局部内选取最优路径
3 不纯度衡量什么?
衡量叶节点是否过拟合,不纯度越低,决策树对训练集的拟合越好。现在使用的决策树算法在分枝方法上的核心大多是围绕在对某 个不纯度相关指标的最优化上。
4 哪些指标可以衡量不纯度?
误差率、信息熵,基尼系数
5 ID3算法是以什么指标来选选择划分的特征?
信息增益最大