全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
3046 1
2019-09-12

CDA数据分析:数据科学、人工智能从业者的在线大学。
数据科学(Python/R/Julia)数据分析、机器学习、深度学习 Q群:874447702


定义

Grubbs检测,也称为最大归一化残差检测,常被用来检验服从正太分布的单变量数据集中的单个异常值。Grubbs检测基于正态假设。也就是说,在应用Grubbs检测之前,首先应验证数据是否可以通过正态分布合理地近似。

原理

Grubbs检测一次检测到一个异常值。从数据集中删除该异常值,并且迭代测试直到没有检测到异常值。但是,多次迭代会改变检测概率,并且检测不应该用于六个或更少的样本,因为它经常将大多数点标记为异常值。

假设检验

Grubbs测试是针对假设定义的:

H0

:数据集中没有异常值

H1

:数据集中只有一个异常值

Grubbs检测统计定义为:

Y、s分别表示样本均值和标准差。Grubbs检验统计量是样本标准差单位与样本均值的最大绝对偏差。

原假设

H

被拒绝,当检验统计量满足以下条件:

实际上,Grubbs检测可理解为检验最大值、最小值偏离均值的程度是否为异常。

实例代码

Grubbs检验#---------------代码范例#Grubbs检验代码实例:#######################################################################函数功能:Grubbs检验#参数说明:x:要进行判断的数据#####################################################################library(outliers)grubbs





二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-9-16 17:58:52
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群