全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
8213 13
2021-02-04
关于交叉项问题,很多人认为在模型中加入交叉项时需要对变量进行中心化,认为这样能够解决多重共线性问题,实际上这种想法是错误的。首先我们从源头上解释有这种想法的原因,我们举一个例子看看。
复制代码




这里的condition number 为31.8179,大于15而且大于30,于是很多人会认为多重共线性相当严重。实际上这是错误的想法,对共线性的检验,我们应该采用中心化后的变量进行collin检验,这样才能真正判断是否存在共线性,我们采用collin,corr命令对中心化后的变量进行多重共线性检验。

复制代码

此时我们会发现,condition number=8.5989<15,说明模型并不存在多重共线性。这个结果才是我们需要汇报在文章中的(如果你想检验共线性的,当然我基本上不做共线性检验)。这就是很多人误以为中心化能减少共线性的原因,因为他认为中心化和非中心化能得到不同的结果,而我认为共线性检验的正确做法是上述第二种,也就是说x1 x2的共线性检验应该是中心化后再做collin检验。
实际上你会发现,无论你在模型中使用原始变量还是中心化变量,对系数估计并没有影响,这一点在黄河泉老师的PPT里讲的比较详细,我就不班门弄斧了。简单给出结果,大家看一下:
复制代码


实际上上述结果是完全一致的,前两种可能要结合经济含义手动算一下就可以得到后两种的结果。
复制代码

所以说中心化并不会解决多重共线性问题,如果你看懂我一开始说道理,原因很简单,那就是我们检验共线性时应该直接对中心化的变量做检验,这样得到的结果就是原始变量的多重共线性检验结果。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2021-7-8 08:11:40
那为啥还要中心化?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-7-8 10:45:31
Bono 发表于 2021-7-8 08:11
那为啥还要中心化?
所以交叉项这里不必中心化
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-7-8 10:45:35
Bono 发表于 2021-7-8 08:11
那为啥还要中心化?
所以交叉项这里不必中心化
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-7-8 11:01:36
知行合一,感谢分享知识.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-7-8 11:24:09
zdlspace 发表于 2021-7-8 10:45
所以交叉项这里不必中心化
如果要中心化的话,
c_x1#c_x2

c.c_x1#c.c_x2
有什么区别
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群