全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
4262 7
2015-10-16
悬赏 10 个论坛币 已解决
1. 最近小弟在做多元回归时遇到了点儿问题,结果见图,为了防止共线性的问题已经采用了逐步回归法而且相关的系数检验也已经通过,但是在观察VIF膨胀方差因子的时候,模型5为何还有超过10的呢?不是已经逐步回归了么?其他的R方,残差的图感觉都还可以啊,为什么在做回归的时候还存在这样的共线性问题?
2. (看了张文彤老师讲解的视频后,他说一般如果多个变量间存在相关性且很强的话,是要考虑用偏相关,但是由于偏相关很少在文章当中使用,所以为了避免审稿人提问,所以进行多元回归分析也可以避免一定的共线性。)做此回归我只是想讨论一下因变量R与其余自变量的相关关系大小,是正还是负相关,并没有想要建立模型预测,这样利用回归分析来展示相关关系可以么?另外D1-D3,Type1-Type3 我设置的为虚拟变量,分别为处理(4分类)和品种(4分类),由于分类变量的存在所以设置了虚拟变量但是具体应该怎么分析呢?在文章当中应该如何叙述这种包含了虚拟变量的因变量与自变量的关系?
3. 如果要把部分数据结果表图放入文章一般应该放哪几个数据指标和图表合适,才能减少审稿人因为看不明白分析结果而引起的过多的提问?
QQ截图20151016220547.jpg

原图尺寸 58.48 KB

结果图6

结果图6

QQ截图20151016220518.jpg

原图尺寸 151.56 KB

结果图5

结果图5

QQ截图20151016220510.jpg

原图尺寸 195.78 KB

结果图4

结果图4

QQ截图20151016220409.jpg

原图尺寸 120.91 KB

结果图3

结果图3

QQ截图20151016220402.jpg

原图尺寸 81.77 KB

结果图2

结果图2

QQ截图20151016220348.jpg

原图尺寸 76.78 KB

结果图1

结果图1

最佳答案

xddlovejiao1314 查看完整内容

回归分为解释型回归和预测型回归。预测型回归可以不用考虑自变量的多少,也不用过多的在建模前对自变量进行假设,直接尽可能的包含多的对因变量有显著影响的变量即可。这种情形下用逐步回归可以。但我个人感觉如果是做解释型回归,用逐步回归处理自变量间的严重多重共线性问题不如用主成分回归。因为解释型回归是想要看每个变量的系数方向和大小(虽然有些变量不显著,但还是想看看其方向,并在专业上寻求变量不显著的原因),且 ...
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-10-16 22:32:42
   回归分为解释型回归和预测型回归。预测型回归可以不用考虑自变量的多少,也不用过多的在建模前对自变量进行假设,直接尽可能的包含多的对因变量有显著影响的变量即可。这种情形下用逐步回归可以。但我个人感觉如果是做解释型回归,用逐步回归处理自变量间的严重多重共线性问题不如用主成分回归。因为解释型回归是想要看每个变量的系数方向和大小(虽然有些变量不显著,但还是想看看其方向,并在专业上寻求变量不显著的原因),且这种回归在构建模型前需要对自变量做出研究假设的。所以虽然我不知道为什么用逐步回归你的模型还是存在VIF>10的情况,但我个人建议你不用逐步回归,而改用主成分回归。先用主成分分析处理严重多重共线性指标,然后再构建回归。
   第二个问题,自变量中含有分类变量,在构建模型时需要将其处理为虚拟变量,然后再纳入模型。具体解释时大概是这样的套路。如以Type变量为例,type4是参照组。这样解释,在其它条件不变的情况下,与Type4相比,Type1怎样,Type2怎样,Type3怎样(一般以倍数来解释的,可参考你这个专业相关文献)。
   至于第三个问题,有些没有必要放那么多东西的。在文中用点话说明一下就行,如在构建模型时对自变量间是否存在多重共线性进行了诊断,然后出现严重多重共线性了,你怎么处理的之类的话就行了。文章投出去,审稿人问到了具体的问题到时在回答补充就行。祝好运。
   
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-17 11:10:49
xddlovejiao1314 发表于 2015-10-17 11:01
回归分为解释型回归和预测型回归。预测型回归可以不用考虑自变量的多少,也不用过多的在建模前对自变量进 ...
非常感谢,想问一下什么叫做构建模型前对自变量进行假设呢?这是什么意思?都改做些什么假设
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-17 11:17:46
a42325913 发表于 2015-10-17 11:10
非常感谢,想问一下什么叫做构建模型前对自变量进行假设呢?这是什么意思?都改做些什么假设
   这可能是好多国内研究者的通病,我以前也犯,都是在2篇SCI/SSCI修稿过程中被老外提出来才引起注意的。在回答这个问题前,如果我是审稿人,看到你的文章,我会问你如下这个问题:为什么你构建的模型要选择这些指标而非另外的一些指标。根据常识,可能除了你选择的这些指标外,其余还有指标会影响模型的因变量。你为什么不选择其它指标呢?其实说白了就是问你选择目前这些自变量构建模型的依据是什么?是根据文献来,是根据理论来,还是根据常识来?如果有依据,那么在构建模型前,很多指标应该都有个先验判断呗。如举个常识性的例子,我们都知道收入一般对消费有正向显著影响,收入越高,消费也越高。那么其实,在构建消费与收入的模型时,前期会做的假设就是H:收入对消费有正向显著影响。同理,你的模型在构建前应该也有类似的东西。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-17 12:06:51
xddlovejiao1314 发表于 2015-10-17 11:17
这可能是好多国内研究者的通病,我以前也犯,都是在2篇SCI/SSCI修稿过程中被老外提出来才引起注意的。 ...
明白了,谢谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-18 20:59:49
好人哪,xddlovejiao1314热心的程度令人敬佩!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群