全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 python论坛
6222 0
2019-12-02

AIU人工智能学院:数据科学、人工智能从业者的在线大学。

数据科学(Python/R/Julia)数据分析、机器学习、深度学习

GaussianNB是高斯贝叶斯分类器,它假设特征的条件分布概率满足高斯分布,其原型为:

class sklearn.naive_bayes.GaussianNB

GaussianNB没有参数,所以不需要调参。

属性说明:

class_prior_:一个数组,形状为n_class,是每个类别的概率P(y=Ck)。

class_count_: 一个数组,形状也为n_class,是每个类别包含的训练样本的数量

theta_:一个数组,形状为(n_class,n_features),是每个类别上每个特征的均值。

sigma: 一个数组,形状为(n_class,n_features),是每个类别上每个特征的标准差。

方法说明:

fit(x, y[,sample_weight):训练模型。

partial_fit(x,y[, classes,sample_weight):` 追加训练模型。该方法主要用于大规模数据集的训练。这个时候可以将大数据集划分成若干个小数据集,然后在这些小数据集上连续调用partial_fit方法来训练模型。

predict(x):用模型进行预测,返回预测值

predict_log_proba(x):返回一个数组,数组的元素依次是x预测为各个类别的概率的对数值。

predict_proba(x):返回一个数值,数组元素依次是x预测为各个类别的概率值。

score(x, y[,sample_weight]):返回测试性能得分(测试分数不超过1,但是可能为负数(当预测效果太差的时候),score值越接近1,说明预测效果越好)。

示例说明


复制代码

运行上述代码后,其结果为

digits_dataset运行结果

下面我们看看给出加载数据集函数和高斯分类器的函数代码:

复制代码


上述代码运行后其结果为

training score set is: 0.859

test score set is: 0.824

我们看到高斯贝叶斯分类器对训练集的预测准确率为0.859,对测试机的预测准确率为0.824,两者准确率相差不大,符合预期结果。


关注“AIU人工智能”公众号,回复“白皮书”获取数据分析、大数据、人工智能行业白皮书及更多精选学习资料!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群