全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
2672 0
2016-03-24
我们在进行回归建模前,一般会对偏态的连续变量做变量变换,转成正态分布的。但是我在具体做变量变换时,出现了以下疑问:

1. 我在做变量变换时,因为有很多变量会出现取值为0的情况,所以不能直接进行对数变换LN(X)。我在其他地方看到的资料说是可以对变量做LN(X+1)或X^(1/3)变换。
我的疑问是:
(1) 有很多变量的取值范围都比较小,如在0~5之内,那用LN(X+1)是否会影响到变量原来的性质?因为我发现对于取值范围小的变量,用LN(X+1)变换后并没有较好地达到正态分布的效果,效果没有做X^(1/3)变换的好。
(2) 我是否可以对对有些变量做X^(1/3)变换(如取值范围较小的变量),有些变量做LN(X+1)变换(如取值范围较大的变量)?即在做变量变换时,能否对不同的变量用两种不同的方法?

2. 对于比例变量,取值范围0~1,是否需要 或者 是否可以做变量变换?


请各路大神赐教![em34]


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群