全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
12396 28
2006-02-18
请问在横截面数据中对于特异值的剔出和剔出标准是怎样的?数据的探索性分析是否应在剔出了特异值之后再进行?数据的处理步骤主要包括哪几部?请那位学友给与解答。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2006-2-18 16:58:00
你看 参考一下东南大学出版社《统计诊断》,韦博成著
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2006-2-18 23:50:00

我在C.R.RAO 的《统计与真理》中好像看到过,上面说异常值在无法重复试验的情况下,目前还是统计中无法解决的难题!通常的处理方法有三种:1,去掉异常值。2,去掉异常值并补充一个新值(新值可通过某种算法得到)。3,保留异常值!

其实上述三种处理方法的原理很简单:1,2是把异常值当作小概率事件,3是把异常值当作大概率事件——即具有“厚尾”或“肥尾”的概率分布!

我似乎没有直接回答你的问题!而是从理论的角度给你指了个方向!如果你是只注重应用,那么楼上指的书你不妨看看!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2006-2-19 11:22:00

感谢两位学友的指教,我曾请教过一位统计专家,他说好像是在均数加减标准差乘以三倍,这以外的数就是特异值的范围。

《统计诊断》这本书我没有,也还没有找到,不知谁还可以给我指教一下?

我现在正在做论文,800多家企业的数据大约有10%左右属于这位专家的奇异值范围,是不是都应剔除,剔除的数量大不大?请各位高手予以指点。多谢。

[此贴子已经被作者于2006-2-28 17:28:02编辑过]

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2006-2-19 19:38:00

For time series data (especially for ARMA model) there are standard method for detecting the outliers.

Concerning OLS-type regression type, robust method include med-med median of median (such algorithm may not be available with usual canned pachage such as SPSS. Eviews)

I have no idea about panel.

But if you think that some 企业 come from different population, then you can simply ignore them or use some Dummy to handle it.

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2006-2-19 20:47:00
我用的是企业类的横截面财务数据,计量软件是spss13.0,你的意思是不是将特异值剔除,我用spss挑出了近80个特异值,是否都要剔除?请解答。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群