全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
1114 0
2013-11-26

找出并剔除数据的“中间地带”


找出并剔除数据的“中间地带”,可以使后续的计量统计结果更加准确。

举个例子,Y=aX1+bX2 +ξ,(Y,X1,X2)都可以查到数据,通过模型可求出a,b ,此时ξ=Y-aX1-bX2也是可以算出来的,这样就得到了n多个残差~~现在将残差赋予经济含义 假设残差大于零表示该企业投资过度 残差小于零表示投资不足 之后根据投资过度和不足将数据分成两类 进行后续对投资效率的分析。

但是按照现实情况考虑,介于投资过度和投资不足之间可能会存在中间领域,即有一部分企业投资刚好或者是适度的,但是这些企业所计算出的残差ξ未必等于零,但可能很接近0。





       现在的问题是,如何剔除这些投资较为合理的企业(这些企业只是占小部分的),或者说如何设定一个合理的度或者说是区间范围?(比如C,C>0 ,那么假如某个企业所计算出的残差属于[-C,C]之间的可以说明该企业投资合适,在后续分析时需要剔除该企业。 )       最好有相关理论作为支持,或者能给我一些先关的书籍或者文献。



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群