全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
4264 5
2013-11-15
多元回归分析中如何选择变量删选的准则?我用向后法和进入法做出来的模型有差别,而用逐步法却做不出来,怎么办?另外,因子分析中提取出来的因子可以作为因变量吗?还有,多元回归分析中对自变量有没有要求,是否需要对所有自变量中的分类变量进行虚拟,如果要进行虚拟,虚拟的准则又是什么,有一些自变量的逻辑顺序和因变量不一样,我是否该调整这些自变量的顺序。例如,我提取出一个ZF信任因子,里面有对ZF、公安、法院等的信任程度等题目,这些题目都是1完全不可信到5完全可信,我想把这个做为因变量;而自变量里有些题目例如和亲戚的来往程度如何1为非常频繁,而5为很少来往。而我的假设是越经常来往的越有可能产生信任。这样我需要对这道亲戚来往程度的答案进行虚拟吗?如果要,是不是应该把很少来往设置为0,然后一次来往非常频繁设置为4这样?另外,多元回归分析中对自变量和因变量有什么要求?模型的检验有该如何做?
      恳请各位大神赐教!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-11-16 15:50:21
没明白什么叫逐步法做不出来,stepwise大意是先算一个自变量,然后再放几个自变量进去看是不是符合你设置的进入和剔除的sig,不符合就剔除,合适就继续放这样,如果变量太多的话用这个比较方便。进入就是强制把所有变量变成一个回归,后退应该跟stepwise相反吧,就一步一步剔除这样,我猜。后退我没有用过,你可以忽略我的想法。理论上因子可以作为自变量应该也可以作为因变量,但是个人觉得这样就没有什么实际意义,因为你预测的是一个你无法知道合成公式的合成物,做回归不就是为了预测比如顾客会不会买会买多少的问题么。关于这个逻辑顺序,我认为没有太大的影响,你试想一下你最后得出的模型,这个自变量填什么还是根据题目来的,就是你可能需要花时间去解释或者理解每一个自变量的值所代表的含义。当然如果所有自变量顺从同一个逻辑顺序会比较有利于你之后的理解,就看到5就一定是非常满意这样。这个软件只管数据不管资格数据代表的含义。然后有什么要求这个问题好模糊不知道你想问什么,基本就互相独立各种独立,评估的话一般看adjusted R square,就R方啦,0-1,越大越好,太大比如有0.9就不行了,说明自变量和因变量有相关不独立。一般实际问题大数据的话,能做到0.3 这个模型就差不多了。还有人会看F值,越大说明越显著。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-11-16 23:38:41
Michellechao 发表于 2013-11-16 15:50
没明白什么叫逐步法做不出来,stepwise大意是先算一个自变量,然后再放几个自变量进去看是不是符合你设置的 ...
我想问的是多元回归分析中因变量必须是连续型变量吧,自变量如果又有连续型变量,有有两分类变量,又有多分类变量,那该如何做呢?可否加你扣扣?我的462764489
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-11-16 23:49:09
Michellechao 发表于 2013-11-16 15:50
没明白什么叫逐步法做不出来,stepwise大意是先算一个自变量,然后再放几个自变量进去看是不是符合你设置的 ...
我知道逐步法为什么没做出来了,因为自变量的全都对因变量的影响不显著。我看到一篇文章,里面貌似是用因子来做因变量了,想发给你看看,探讨下。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-11-18 19:52:28
如果你说的自变量不是连续型变量的话没有关系,但是如果因变量是二分类就要用logistic regression
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-11-18 20:02:49
Michellechao 发表于 2013-11-18 19:52
如果你说的自变量不是连续型变量的话没有关系,但是如果因变量是二分类就要用logistic regression
谢谢,我好像做出来了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群