sunny@RUC 发表于 2016-2-8 17:24 
不,我是分开做了两个模型。
一个模型是城市样本,一个模型是农村样本。
城市样本里,那些变量都显著。 ...
哦哦我明白了,您是分别用两组样本做了两次模型,但是自变量都是年龄和收入。
但是我觉得您现在想做的是收入和年龄对纠纷解决偏好的影响,那么就找一堆样本直接做就可以了,为什么一定要区分样本呢?当然这样做也可以,只是做了两组模型之后为什么又要设置“收入”这个自变量呢?在我看来城市和居民两个样本本身就已经反映了收入水平的高低,也就是说,即使样本的方差比较大,城市样本的收入平均值一定是高于农村样本的。
所以我建议要么把所有样本放在一起做两个维度,要么区分自变量但是另外设置一个自变量。但是这样的话最后对回归结果的解释又不一样了,而且也无法判断收入对因变量究竟是否有影响。
如果一定要解释您目前得出的回归结果也是可以的。我觉得可以这样解释:高收入与纠纷解决偏好相关而低收入人群无法预测出他们的纠纷解决偏好。而年龄,正常来说不应该出现在不同群体有不同显著性的结果,因为年龄的回归系数与收入的高低是没有关系的。也就是说,无论是在城市还是农村的模型,年龄对因变量的显著性应该一致。所以我认为出现这种偏差的可能性应该是采集的样本本身的问题。也就是说,可能农村居民年龄的方差很小,大部分年龄都 集中在同一个区间,因此无法判断其显著性。建议检查一下描述性分析得到的结果。
希望对您有帮助~