全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
545 0
2022-11-11

导入相关库:



导入数据


为了开始执行离群值测试,我们将导入一些每10分钟采样的平均风速数据






说明:在任何数据集中, outlier都是与其他数据点不一致的基准点。 如果从特定分布采样的数据具有高概率,则异常值将不属于该分布。 如果特定点是异常值,则有各种测试用于测试,这是通过常态测试中使用的相同的空假设测试来完成的。


Q测试


Dixon的Q-Test用于帮助确定是否有证据表明某个点是一维数据集的异常值。 假设数据集是正态分布的。 由于我们有非常有力的证据表明我们的数据集在所有正态检验都是正态分布 ,因此我们可以在此处使用Q-Test。 与正太检验一样,我们假设显着性水平为0.05美元,为简单起见,我们只考虑集合中的最小基准点。




对于我们的示例,Q统计量是集合中最小和最接近数字之间的绝对距离与数据集范围的比率。 这意味着:




对于我们的示例,我们将从包含完整数据集中的最小值的数据集中获取30个值,并对该样本应用测试。 然后我们将数组转换为列表并通过增加值对其进行排序。





二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群