找出并剔除数据的“中间地带”
找出并剔除数据的“中间地带”,可以使后续的计量统计结果更加准确。
举个例子,Y=aX1+bX2 +ξ,(Y,X1,X2)都可以查到数据,通过模型可求出a,b ,此时ξ=Y-aX1-bX2也是可以算出来的,这样就得到了n多个残差~~现在将残差赋予经济含义 假设残差大于零表示该企业投资过度 残差小于零表示投资不足 之后根据投资过度和不足将数据分成两类 进行后续对投资效率的分析。
但是按照现实情况考虑,介于投资过度和投资不足之间可能会存在中间领域,即有一部分企业投资刚好或者是适度的,但是这些企业所计算出的残差ξ未必等于零,但可能很接近0。
现在的问题是,如何剔除这些投资较为合理的企业(这些企业只是占小部分的),或者说如何设定一个合理的度或者说是区间范围?(比如C,C>0 ,那么假如某个企业所计算出的残差属于[-C,C]之间的可以说明该企业投资合适,在后续分析时需要剔除该企业。 ) 最好有相关理论作为支持,或者能给我一些先关的书籍或者文献。