全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
24048 4
2015-10-13
悬赏 10 个论坛币 已解决
现有A-H 8个变量,之间存在显著或极显著的相关关系,相关系数部分变量之间可以达到0.9以上,因此在单独分析A与另外7个变量之间的两两相关时考虑使用偏相关分析,但是关于偏相关分析时的控制变量应该怎么选择?
假设:分析A与B 的相关性(分析A变化时B随着A怎么变化),与A相关的有BCD,与B相关的有ACDEF,那么选则控制变量时是应该怎么选择?是选择与AB均有相关性的CD,还是取两者的合集CDEF?还是有什么别的选择方法。
另外有关相关系数达到多少便可以考虑之间存在相关关系呢。
控制变量是否可以选择多个变量,如果要控制的变量中存在分类变量,进行虚拟化后可以放入控制变量中进行偏相关分析么??

最佳答案

xddlovejiao1314 查看完整内容

楼主的问题是好问题。我仔细的想了下,如果是我遇到了,我会怎么处理。下面提供点我的思路,供参考: 就像做回归一样,解释其中某个自变量对因变量的影响情况时,我们都会说:在其它情况不变的情况下,自变量每增加一个单位,因变量怎么变。那么对应到楼主这个问题,楼主其实想探究的是A与B之间的净相关,即控制了其它变量后A与B之间的相关。如果将B作为因变量,A作为自变量。那么如果仅构建A与B的模型那么模型肯定存在 ...
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-10-13 11:29:05
     楼主的问题是好问题。我仔细的想了下,如果是我遇到了,我会怎么处理。下面提供点我的思路,供参考:
     就像做回归一样,解释其中某个自变量对因变量的影响情况时,我们都会说:在其它情况不变的情况下,自变量每增加一个单位,因变量怎么变。那么对应到楼主这个问题,楼主其实想探究的是A与B之间的净相关,即控制了其它变量后A与B之间的相关。如果将B作为因变量,A作为自变量。那么如果仅构建A与B的模型那么模型肯定存在遗漏变量的危险。这时,即使楼主将与B相关的ACDEF均纳入模型,那也还是有遗漏变量的危险,只是相比于只纳入A的模型,后面这个模型拟合效果可能更好。如果从这个角度理解,我要求A与B之间的净相关系数(相对准确的),就像上面一样,把B作为因变量,A作为自变量,CDEF作为控制变量纳入模型即可。
    至于控制变量有分类变量的问题,正如你所说,如果我来做,我是将其处理为虚拟变量,然后纳入模型即可的。祝好运~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-13 11:30:04
自己顶
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-16 17:54:44
xddlovejiao1314 发表于 2015-10-13 11:29
楼主的问题是好问题。我仔细的想了下,如果是我遇到了,我会怎么处理。下面提供点我的思路,供参考:
...
仅从偏相关的定义来看必须要是与因变量与自变量都存在相关的变量作为控制变量才合理,不过定义也不是很清楚的,还是谢谢你的解答。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-2-14 14:30:26
学习一下,受教了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群