全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
7042 9
2011-11-30
project 是用sas regression分析著名的 boston housing data, 找到最好的model

请问各位大牛我能感觉有很多outlier但是怎么找到呢????

附件里是数据,谢谢

附件列表

housing.txt

大小:48.43 KB

 马上下载

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-11-30 13:18:55
假如一些变量大致服从正态分布,可将3*sigma之外的数据剔除
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-11-30 13:19:40
实在是看不清 无法选择了,没办法做啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-11-30 13:23:54
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-11-30 13:28:20
tj0412ymy 发表于 2011-11-30 13:23
或者干脆一刀切,将低于5%的分位数和高于95%的分位数的值全部删除掉
那这样不会不精确吗? 而且我都不知道怎样切?
目前我就做过切一个outlier的题...现在这么多看都看不清楚..
好像老师说切过多也不对,所以我真的不知道怎么办了..
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-11-30 13:29:30
joelluo 发表于 2011-11-30 13:19
实在是看不清 无法选择了,没办法做啊
我也是看不清,但是想想如果剔出outlier 可能就行了..
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群