全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
5302 0
2022-03-24

ROUT的基础原理


ROUT法是一种从非线性回归中识别异常值的方法。


简而言之,首先通过采用一种稳健的方法将一个模型拟合至数据中,其中异常值的影响很小。然后使用一种新的异常值检测方法,根据错误发现率,来决定哪些点与模型的预测相差较远,即称为异常值。


当你要求GraphPad Prism检测列数据堆栈中的异常值时,可简单地采用这种方法。


GraphPad Prism将你输入的值视为Y值,并拟合Y = M模型,其中M是一个稳健的平均值。(如果你想通过GraphPad Prism的非线性回归分析来实现这一点,需要给每行指定任意的X值,然后拟合至模型Y = X*0+M中。)


此方法可检测任意数量的异常值(可达样本量的30%)。


在一个数据集中,GraphPad Prism最少可使用三个值来执行ROUT检验。


Q是什么?


ROUT法建立在错误发现率(FDR)的基础上,因此可以指定Q表示最大预期FDR。对Q的解读取决于数据集中是否有异常值。


当没有异常值(且分布完全为高斯分布)时,Q与α极其相似。假设所有数据都来自高斯分布,则Q表示(错误)识别一个或多个异常值的可能性。


数据中存在异常值时,Q表示最大预期错误发现率。如果将Q设为1%,你的目标为不超过1%的识别异常值是假的(实际上只是高斯分布的尾部),至少99%为实际异常值(来自不同的分布)。


参考文献


Motulsky HM和Brown RE,在用非线性回归拟合数据时检测异常值 - 一种以鲁棒非线性回归和错误发现率为基础的新方法,《BMC生物信息学》(2016),7:123。



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群