全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
3664 1
2014-12-30
我做了一个关于自杀意念的测试,有540个人参加,但是300多人都没有自杀意念,得分为0,剩余的得分也很低,总之,是个低自杀人群。数据变量做出来是严重的正偏态:转换时候发现。

. ladder preTT1
Transformation         formula               chi2(2)       P(chi2)
------------------------------------------------------------------
cubic                  preTT1^3                   .        0.000
square                 preTT1^2                   .        0.000
identity               preTT1                     .        0.000
square root            sqrt(preTT1)               .        0.000
log                    log(preTT1)                .            .
1/(square root)        1/sqrt(preTT1)             .            .
inverse                1/preTT1                   .            .
1/square               1/(preTT1^2)               .            .
1/cubic                1/(preTT1^3)               .         
那么我的问题是:
1.可不可以把变量都加上个常数,然后进行BOX-COX的求lamida?因为太多的零,不能求对数。
2,转换后用这个变量做回归的因变量,如果自变量没有变是不是可以做回归,还是自变量做同样的调整?
3,如果自变量和因变量都是偏态,要用同样的转换正态的方法进行么?
谢谢了啊~!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-8-22 14:13:22
      楼主想用自杀意念作为因变量,那么为什么要想着将其转换为符合正太分布的变量呢?这本来就是一个二分类的类别变量,直接构建二元logistic/probit回归模型即可。同时,在构建多元回归模型时,一般要求的是自变量符合独立同分布,同方差,并没有对因变量做过多要求额。
      对于存在偏态分布的自变量,如果是右偏态/正偏态,直接取对数对其进行转化即可;如果变量中含有很多0,且数据分布右偏(就像自杀意念这种指标),取对数没多大意义,可根据常识/文献对此变量进行分段,大于a的数据编码为1,小于a的编码为0,将这种变量处理为类别变量,然后以虚拟变量的形式将此变量纳入模型。祝好运。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群