全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
4280 2
2022-04-07
格拉布斯(Grubbs)和ROUT法都是常用的检验异常值的方法,那么,两种方法的使用场景有什么区别,孰优孰劣呢?

简言之,根据高斯分布对数据进行抽样。大多数情况下均有添加异常值(根据具有特定限制的均匀分布得出)。对每项实验设计模拟25,000次后,列出了零个、一个、两个或两个以上异常值的模拟次数。


当没有异常值时,ROUT检验和Grubbs检验的表现基本相同。为ROUT方法指定的Q值等于你为Grubbs检验设置的α值。


当有一个异常值时,Grubbs检验能够较容易检测到该值。ROUT方法具有更高的漏报率和误报率。换言之,即使模拟只包含一个异常值,该方法也更有可能遗漏异常值,并且更有可能发现两个异常值。这并不令人意外,因为Grubbs检验的目的就是检测一个异常值。尽管两种方法之间的差异很明确,但并不显著。


当在一个小数据集中包含两个异常值时,ROUT检验表现更好。Grubbs迭代检验会受到遮蔽的影响,而ROUT检验则不然。遮蔽是否是个问题取决于样本量以及异常值与其他值平均值的偏离。在非常有可能发生遮蔽的情况下,ROUT检验 显著优于 Grubbs检验。例如,当n = 10且有两个异常值时,Grubbs检验从未发现这两个异常值,并且在98.8%的模拟中两个值均遭到遗漏(在剩余的1.2%模拟中,Grubbs检验发现了两个异常值中的其中一个)。相比之下,ROUT方法在92.8%的模拟中识别出两个异常值,而在6%的模拟中遗漏两个异常值。


总结:

  • Grubbs检验略优于ROUT方法,专为以下任务而设计:从高斯分布中检测单个异常值。
  • 在某些情况下,就检测两个异常值而言,ROUT法要比Grubbs迭代检验好得多。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-4-9 11:08:12
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-20 11:29:06
感谢分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群