全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
34701 14
2014-06-04
悬赏 50 个论坛币 未解决
在多元回归后做残差图分析可以找到异常值,如下四图:
1. 普通残差与拟合值的残差图
2. 正态QQ的残差图
3. 标准化残差开方与拟合值的残差图
4. cook统计量的残差图
一般情况下需要肉眼观察残差图找到异常值所在的点,但是如何通过程序获得这些异常值所在位置呢?比如图1/2/3中的54,65,295点,还有图4中的163,168,285点?

补充:感谢Aharach的回答,目前唯一剩下的问题是R根据什么标准确定残差图1-3中的三个异常值呢?
图1 普通残差与拟合值的残差图                                                   图1     
图3 QQ图
                                                 图2
图2 Scale-Location图
                                                 图3  
图4 cook统计量的残差图
                                                    图4



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-6-5 01:15:58
感觉你的residual不是白噪声,特别是在分布的两端拟合的不好。你要不先把y取对数,log(y)可能更加接近正太分布。然后可能对结果有改善,再来检查如何去除异常值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-6-5 10:18:47
sllhappy0729 发表于 2014-6-5 01:15
感觉你的residual不是白噪声,特别是在分布的两端拟合的不好。你要不先把y取对数,log(y)可能更加接近正太分 ...
我只是举了个例子,并不是针对已上数据。我问的是什么样的R代码可以获取异常值及其对应的样本点,最终目的是找到样本点并删除。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-6-5 17:26:58
没有高人能帮忙解答吗。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-6-5 23:06:10
dufegao 发表于 2014-6-5 17:26
没有高人能帮忙解答吗。。。
我觉得很难说,你的数据很多,从你的图来看可以说基本没啥异常值。即使剔除几个数值,也不会改变你的结果,比如slope R2等等。你说的方法都可以帮助你剔除,但是你的数据还不错,所以很难说哪个是异常值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-6-6 03:01:03
看看下面的代码能不能满足你的要求:
复制代码

目的是把所有residual中大于0.2的数据行数显示出来,然后你就可以想干什么就干什么了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群