我们在进行回归建模前,一般会对偏态的连续变量做变量变换,转成正态分布的。但是我在具体做变量变换时,出现了以下疑问:
1. 我在做变量变换时,因为有很多变量会出现取值为0的情况,所以不能直接进行对数变换LN(X)。我在其他地方看到的资料说是可以对变量做LN(X+1)或X^(1/3)变换。
我的疑问是:
(1) 有很多变量的取值范围都比较小,如在0~5之内,那用LN(X+1)是否会影响到变量原来的性质?因为我发现对于取值范围小的变量,用LN(X+1)变换后并没有较好地达到正态分布的效果,效果没有做X^(1/3)变换的好。
(2) 我是否可以对对有些变量做X^(1/3)变换(如取值范围较小的变量),有些变量做LN(X+1)变换(如取值范围较大的变量)?即在做变量变换时,能否对不同的变量用两种不同的方法?
2. 对于比例变量,取值范围0~1,是否需要 或者 是否可以做变量变换?
请各路大神赐教!

[em34]