全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
28159 27
2015-04-20
请问极端值一定要删除吗?比方说测量人们的压力,确实有些人的压力大,得分高,这样就会被箱形图确定为异常值,需要删除吗?
如果删除*和O 的异常值,发现重新诊断异常值又会出现新的异常值 O,再次处理后,还会出现,这样一直删除下去吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-4-20 17:32:06
极端异常值有几种处理方式:一是做相应的变化处理,如取对数(因为ln(10)和ln(10000)的差距比10与10000的差距小多了);此外,可做分组处理(如你说的测量压力,可以分为高中低三组,然后再以虚拟变量的方式纳入模型就好);当然,也可去除极端异常值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-4-20 18:44:12
xddlovejiao1314 发表于 2015-4-20 17:32
极端异常值有几种处理方式:一是做相应的变化处理,如取对数(因为ln(10)和ln(10000)的差距比10与10000的差 ...
谢谢!可能我没表达清楚,我更想知道是否一定得删除,还是以压力为例,如果有的人就是压力大肯定得分高呀,这就得按极端值删除掉吗?再次感谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-4-20 19:05:26
实际上,要看你的用途,如果你要用数据做回归分析,那么极端值的存在会对结果造成很大影响,那么必须得对极端值进行处理,处理方式包括缩尾和删除。如果仅仅是做描述统计,看哈结果是不必处理的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-4-20 19:46:31
明明重庆2013 发表于 2015-4-20 18:44
谢谢!可能我没表达清楚,我更想知道是否一定得删除,还是以压力为例,如果有的人就是压力大肯定得分高呀 ...
我觉得我的回答已经说得够清楚了哦,亲。样本量大你可以删除,样本量小不删除,对其进行处理(如取对数,分成类别变量等)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-4-20 19:48:00
lemonwp 发表于 2015-4-20 19:05
实际上,要看你的用途,如果你要用数据做回归分析,那么极端值的存在会对结果造成很大影响,那么必须得对极 ...
非常感谢!还想请问,如果是做相关分析呢?个体的两个特征是否相关,这种情况是否需要处理极端值呢?谢谢~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群