全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
3031 5
2015-06-09
我想做一个医学指标的诊断标准,样本量10000多,发现这一指标的影响因素,譬如身高、体重有575个异常值,5%的异常率,异常值如何处理才能保证诊断标准比较科学?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-6-9 09:42:43
winsor可以处理吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-6-9 09:46:59
spss呢?我只会用这个?主要我不需要构建模型。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-6-9 09:51:54
由于你样本量比较大,所以如果是做回归,可以考虑用分位数回归去探究最后5%群体的特征的。winor这个命令会使得样本信息损失很多的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-6-9 10:29:03
是专门把异常值提出来吗?回归分析哪个是分位数回归呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-6-9 22:53:48
小黑羊的影子 发表于 2015-6-9 10:29
是专门把异常值提出来吗?回归分析哪个是分位数回归呢?
嗯,如果你专业上认为极端异常值分析是有意义的,就应该将它们也包含进来,一起分析。至于分位数回归的介绍,可看陈强老师《高级计量经济学及Stata应用》(第二版)第26章(509-517),有原理和案例介绍。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群