python机器学习API介绍9: 高斯贝叶斯分类器(GaussianNB)

6222

收藏 2019-12-02

AIU 人工智能学院：数据科学、人工智能从业者的在线大学。

数据科学（Python/R/Julia）数据分析、机器学习、深度学习

GaussianNB是高斯贝叶斯分类器，它假设特征的条件分布概率满足高斯分布，其原型为：

class sklearn.naive_bayes.GaussianNB

GaussianNB没有参数，所以不需要调参。

属性说明：

class_prior_：一个数组，形状为n_class，是每个类别的概率P（y=Ck）。

class_count_：一个数组，形状也为n_class，是每个类别包含的训练样本的数量

theta_：一个数组，形状为（n_class,n_features），是每个类别上每个特征的均值。

sigma：一个数组，形状为（n_class,n_features），是每个类别上每个特征的标准差。

方法说明：

fit（x, y[,sample_weight）:训练模型。

partial_fit（x，y[, classes,sample_weight）:` 追加训练模型。该方法主要用于大规模数据集的训练。这个时候可以将大数据集划分成若干个小数据集，然后在这些小数据集上连续调用partial_fit方法来训练模型。

predict（x）:用模型进行预测，返回预测值

predict_log_proba(x)：返回一个数组，数组的元素依次是x预测为各个类别的概率的对数值。

predict_proba(x)：返回一个数值，数组元素依次是x预测为各个类别的概率值。

score（x, y[,sample_weight]）:返回测试性能得分（测试分数不超过1，但是可能为负数（当预测效果太差的时候），score值越接近1，说明预测效果越好）。

示例说明：

复制代码

运行上述代码后，其结果为：

digits_dataset运行结果

下面我们看看给出加载数据集函数和高斯分类器的函数代码：

复制代码

上述代码运行后其结果为：

training score set is: 0.859

test score set is: 0.824

我们看到高斯贝叶斯分类器对训练集的预测准确率为0.859，对测试机的预测准确率为0.824，两者准确率相差不大，符合预期结果。

关注“AIU人工智能”公众号，回复“白皮书”获取数据分析、大数据、人工智能行业白皮书及更多精选学习资料！

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

栏目导航

分享