以下内容转自 数析学院,只节选了部分,有需要的同学可以直接查看原文
高斯混合模型(Gaussian mixture model,GMM)是常见的一种概率模型类统计学习方法,它通过样本的概率密度分布估计来解决数据样本的聚类问题,在生物学统计与医学统计领域有着广泛的应用。今天将向大家介绍在 Python 中如何利用 Scikit-Learn 库中的相关工具构建高斯混合模型,以及这个模型在 Python 中使用的相关技巧。
首先,我们需要导入相关的可视化以及运算工具库,并构建示例数据:
在 Python 中,我们可以利用 Scikit-Learn 的 GMM 模块中的 GMM 函数构建对应的模型对象,从而进行高斯混合模型聚类:
聚类的结果如上图所示,我们可以调用 predict_proba
函数,计算每一个样本点的分类概率:
[[ 0. 0. 0.475 0.525] [ 0. 1. 0. 0. ] [ 0. 1. 0. 0. ] [ 0. 0. 0. 1. ] [ 0. 1. 0. 0. ]]
以上内容节选自 数析学院,原文还有 k-means 聚类效果对比、双月牙形的数据样本聚类效果评价、手写数字像素图聚类处理等,内容较多,先搬运到这,有需要的同学可以先直接到 数析学院 查看原文