全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 python论坛
3030 1
2017-07-14


以下内容转自 数析学院,只节选了部分,有需要的同学可以直接查看原文

核密度估计(kernel density estimation)是非参数统计检验中的重要方法之一,常用于估计未知的密度函数。今天将向大家介绍在 Python 中如何利用 Scikit-Learn 库中的相关工具,对数据集的样本分布进行核密度估计。

导入可视化库:


复制代码


构建示例数据:



复制代码


可以看到,构建的数据为一维的随机数组,我们对其中后2/3的样本加上整数5。处理之后,其频率分布直方图如下所示:



复制代码
1.jpg

根据频率分布直方图的性质,所有柱形对应的频率之和为1:


复制代码
1.0
频率分布直方图是非参数统计中的重要可视化方法,为了演示方便,我们构造一组规模相对较小的数据集:
复制代码
在 Python 中,我们可以自定义直方图中的分组。下面我们用两种不同的分组方式,绘制两幅频率分布直方图,并将数据集中每个样本的值标注在横轴刻度下方。其中,右图为将默认的分组边界向右平移0.6之后的频率直方图结果:
复制代码
2.jpg

以上内容节选自 数析学院,原文内容较多,先搬运到这,后续有时间再补充,有需要的同学可以先直接到 数析学院 查看原文
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-7-18 11:33:02
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群