由于你的原始数据有115条,所以我想删掉一些样本不会构成多大影响。
原始数据中的变量为:因变量ROA(净资产利润率),自变量FH(家族持股比例),我觉得可以考虑先删除因变量中的异常值,如果效果还不是很好,可以再删除自变量中的异常值。
方法如下:
1、先把有关变量的原始数据标准化并保存在数据表中,具体操作如下:
Analyze—>Descriptive Statistcs—>Descriptives...,在Descriptives对话框中选择变量(如ROA)进入Variable(s)...中,并勾选左下角的Save standardized values as variable,点击OK运行,就得到新变量ZROA。
2、然后再根据判断异常值的原理将有关异常值从原始数据中过滤掉,具体操作如下:
Data—>Select Cases...在Select Cases对话框中,单选If condition is satisfied,并点击按钮“If...”,从而进入Select Cases: If对话框,在输入框中键入有关公式,比如: - 2 <= ZROA & ZROA <= 2。该式表示ZROA在-2和2个标准差之内。
一般认为在2个(或3个)标准差之外的值为异常值。
3、通过以上步骤,就可以将异常值过滤掉,这些值将不再参与到后续进行的有关运算中来。
不知道这样解释你能否明白?
[此贴子已经被作者于2007-6-20 16:49:13编辑过]