全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
16992 12
2012-03-07
非常谢谢。顺便问一下下面两种操作,分别可以达到怎样的剔除异常值的效果?
PS: 顺便附上俩分别按照“百分比-比如前后各5个%”和“切成小块-比如切成20块,删除前后各2块”的两个剔除利群值的操作。
-------------------------------------------
*设解释变量是x,被解释变量是y

cumul y, g(s) eq
cumul x, g(t) eq
replace y=. if s<.05|s>.95
replace x=. if t<.05|t>.95
drop s t
-------------------------------------------
*还可以用

xtile s=y,nq(20)
xtile t=x,nq(20)
replace y=. if s<2|s>19
replace x=. if t<2|s>19
drop s t
-------------------------------------------

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-3-7 14:58:11
贴部分数据出来嘛~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-3-7 15:07:35
aolei 发表于 2012-3-7 14:58
贴部分数据出来嘛~
INV        local
0.122803787        2
0.041955347        2
0.134040709        2
0.007618153        2
0.017289108        1
0.049179033        1
0.017389606        2
0.051376119        1
0.007567811        2
0.000972777        1
0.142911216        1
0.051098153        2
0.052594731        2
0.063840659        1
0.030737248        1
0.047314124        1
0.106866105        2
0.075816657        1
0.136969435        1
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-3-7 15:24:23
*可以稍微跑一下,看一下结果
clear
set obs 100
gen x=_n
gen y=_n

cumul x, g(t) eq
replace x=. if t<.05|t>.95

xtile s=y,nq(20)
replace y=. if s<2|s>19

list
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-3-7 15:34:21
剔除3sigma以外值,前提是正态分布吧?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-3-7 15:35:54
aolei 发表于 2012-3-7 15:24
*可以稍微跑一下,看一下结果
clear
set obs 100
哦,谢谢。所以,在正态分布的前提下,只要删除前后1%的数值,就等于说,我们已经做到剔除3个标准差外的异常值了,是么? --我数学很白痴,请大家不要上火。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群