2.处理分位点的选择:通常采用99分位还95分位?
A: 一般是 99th。对于极个别离群值很严重的变量,如果需要特殊处理,需要在文中说明。参见如下两篇文章(前者是标准的 99th winsor,后者则是个别处理,p.678):
Flannery, M. J., K. P. Rangan, 2006, “Partial adjustment toward target capital structures”, Journal of Financial Economics, 79 (3), pp. 469-506.
Cleary, S., 1999, “The Relationship between Firm Investment and Financial Status”, Journal of Finance, 54 (2), pp. 673-692.
3.假如使用drop,其是需要对每一个关键变量的边界值进行,还是只需要取几个最核心的?drop各个变量的边界值时,变量如何排序,即先drop哪个变量的边界值?其可能会显著影响最终结果。
A: 使用 drop 主要是针对那些明显不合理的观察值,如总资产小于零,或销售额小于零的观察值。至于你提及的后续几个问题,我没有考虑过,也不知是否需要这么细致的处理。
参见下文 pp.677:
Cleary, S., 1999, “The Relationship between Firm Investment and Financial Status”, Journal of Finance, 54 (2), pp. 673-692.