AIU人工智能学院:数据科学、人工智能从业者的在线大学。
数据科学(Python/R/Julia)数据分析、机器学习、深度学习
scikit-learn中有两个函数可用于获取分类器的不确定度评估:decision_function和predict_proba。大多数分类器都至少有其中一个函数。下面我们来构造一个GradientBoostingClassifier分类器(同时拥有decision_function和predic_proba两个方法):
运行后结果如下图:

分类器的不确定性评估
decision_function可以在任意范围内取值,这块取决于数据与模型参数,下面我们利用颜色编码在二维平面中画出所有点的decision_function,还有决策边界,后者我们之前见过,对应代码如下:
运行后结果如下图:

梯度提升模型在一个二维玩具数据集上的决策边界(左)和决策函数(右)
由上述运行结果可知,同时给出预测结果和分类器的置信度,这样给出的信息量更大。尽管如此,我们很难分辨出两者之间的边界,对此,我们将在下一节继续讨论!