全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
35988 11
2016-01-08
在做多元线性回归时,如果采用原始数据,对由于量纲的影响,有的变量回归系数特别小,几乎可以忽略不计的程度。请问是否可以对自变量进行标准化后再做回归?还是对因变量和自变量都做标准化后再回归呢?如果我只对自变量做标准化,最后得到的回归系数正负值是否还是代表对因变量的正向或负向的影响呢?在解释的时候,该怎么说呢?不能说成自变量改变一个单位,因变量增加或减少多少吧。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-1-8 13:04:45
单位不一致的时候需要处理,以消除量纲对不同数据的影响再者拟合时,如果趋势不同要处理。因变量不用变
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-1-10 04:00:38
你的意思是说 X 的单位都不一样吗,比如X1 是 0到10的 scale, X2是 0 到 100 的 scale? 如果是这样的话,直接看adjusted 系数就可以,adjusted就是帮你调整好了的。

我当时看的是德国人写的多变量分析的书,黄色的,豆瓣没找到,这是它的主页 http://www.multivariate.de/Chinesische-Ausgabe.html

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-1-10 11:54:42
首先,原始数据是什么?假设你用问卷测量,那么你是用问卷均值还是总和作为变量得分?一般建议采用均值,这能有效避免系数过小导致的原因。假设x1采用4点计分,x2采用7点计分,非标准化系数是可以解释的,Hayes(2013)建议不要标准化.
其次,如果你要标准化,在自变量和因变量皆为连续变量的时候,应当将自变量和因变量同时标准化。
另外,标准化前后系数之正负作用相同、含义不变。
最后,对于标准化后结果的解释——应当解释为当x变化多少个标准差时,y变化多少个标准差。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-1-10 12:48:05
bfzldh 发表于 2016-1-10 11:54
首先,原始数据是什么?假设你用问卷测量,那么你是用问卷均值还是总和作为变量得分?一般建议采用均值,这 ...
如果只对自变量做标准化,结果仍然解释为自变量变化多少个标准差,因变量变化多少个标准差吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-1-10 20:55:47
sxzjandy 发表于 2016-1-10 12:48
如果只对自变量做标准化,结果仍然解释为自变量变化多少个标准差,因变量变化多少个标准差吗
不是。那样的话,应该说“自变量变化多少个标准差,因变量变化了多少个单位(因变量的单位)”。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群