全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
6470 4
2016-06-12
原始数据A是0~1的连续变量,对它进行了处理变成0、1变量a(有意义),其他变量也是连续变量

用了Pearson相关分析,表明其中一个变量b和A/a的显著性是大于0.05的,有点牵强还用了Spearman看了一下,结果是一样的

然后以a为因变量做了一下Logistic回归,用的是forward stepwise conditional,原来相关的还是进入了模型,但是b也跟着进入模型了,而且系数通过显著性检验
而且我看了一下进入的步骤和每一步没进入模型的变量——先进入了一个相关分析显著性通过的变量b1,然后进入了b,后面再进入其他相关分析通过的变量

刚接触SPSS不久,我看到每一步没有进入模型的变量的sig在变化,是不是因为虽然b和a没有相关性,但是b1进入模型后检验对象就和b有更强的相关性了?
这种解释对吗,在正常研究过程里面能被其他人接受吗。。。Orz
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-6-12 17:34:33
    在模型中,自变量与自变量间存在一定的相关是很正常的(这会使得模型中加入新的变量后,原先加入的自变量对因变量的影响系数发生变化)。只要不是严重的多重共线性就行。建议你诊断下变量间是否存在严重的多重共线性。祝好运~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-6-14 10:15:16
xddlovejiao1314 发表于 2016-6-12 17:34
在模型中,自变量与自变量间存在一定的相关是很正常的(这会使得模型中加入新的变量后,原先加入的自变 ...
好的,谢谢~

所以说Logistic回归的时候通过相关分析从大量参数里面选择自变量其实是不怎么科学的啦? 前面看到决策树分类好像有人建议用这种方法,以为可以通用,然而看起来这样会漏掉应该进入模型的参数啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-6-14 10:18:49
sunow77 发表于 2016-6-14 10:15
好的,谢谢~

所以说Logistic回归的时候通过相关分析从大量参数里面选择自变量其实是不怎么科学的啦?  ...
为什么要从相关分析中选择变量呢?想通过这步选择显著的变量么?一般情况下解释型回归变量的选择是要有理论依据的额。祝好运~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-6-14 11:21:19
xddlovejiao1314 发表于 2016-6-14 10:18
为什么要从相关分析中选择变量呢?想通过这步选择显著的变量么?一般情况下解释型回归变量的选择是要有理 ...
嗯,只是看到某篇文章里倾向这么做来减少自变量,当然最后也是把所有可能参数都试了,谢谢~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群