全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
1484 5
2023-10-24
  请问各位老师和同学,在做短面板固定效应模型时,需要考虑多重共线性问题吗?我将面板数据看作pooled data处理来检验多重共线性,有两个变量vif高达25,这两个变量又是显著的,而且基于研究不能剔除或增加变量,是否有其他解决方法?或者可以不做共线性检验吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2023-10-25 23:48:00
首先我觉得有一点需要强调一下,一个变量的VIF 高意味着这个变量作为一个predictor对你dependent variable(因变量)的贡献可以很大程度上被回归中其他变量所解释。因为变量D 的 VIF 归根结底就是个 1/(1-R-square[d]), 这个R-square[d]就是你用你回归中其他控制变量对d 进行回归得到的R-square。正因如此,高VIF意味着:变量D并不是影响你dependent variable(因变量)的新因素,是可以被舍弃的,所以我对你说的“基于研究不能剔除或增加变量” 表示不理解。你基本上是在说:”基于研究,我不能删除一个在回归上显得冗余的变量。“ 作为一个审稿人,我不接受这样的论述。

可能存在问题和解决方式:
(1) 数据问题: 是不是自己处理数据时候出现了问题,有code或者逻辑上的错误,这会导致不必要的变量相关性。包括但不限于,数据拟合中出现的问题,缺失值处理不当。
(2)前置研究论断有误:如果前置研究一致肯定你的这个冗余变量是必须的,那么你也可能可以勇敢去质疑他们(但是必须基于你数据处理过程的严谨性和完备性)
(3)raw data 中不同变量间 covariance太高:针对这个问题,你可以尝试 centerizing 所有参与回归的变量。一般来说,这都会显著降低变量之间的covariance,但是因为你控制了固定效应,所以对回归系数的影响应该不大。

希望上面的个人看法对你的研究有帮助。建议以严谨研究为前提,按照(1) -> (2) -> (3) 的步骤来审视你的问题。祝科研顺利。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-10-26 09:08:33
如果个体内部存在高度共线性,可以考虑以下方法:
删除共线性严重的变量之一
构建正交化的交叉项,取代原始交叉项
使用主成分分析等方法构建正交变量
采用整体化方法,如脊回归等
容忍一定程度共线性,因为固定效应模型可以部分缓解这个问题
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-11-1 09:59:00
实践中,多重共线性多模型拟合的伤害不算大,但是对特征的参数影响较大,或者说变量的解释能力影响较大,如果你想用这个变量去解释对目标标签的拟合能力,那踢出相关性较大的变量是前提。如果只是考虑模型拟合的好坏,可以加下正则等处理措施保证模型效果就行。多重共线性在机器学习中很少单独、专门去检验。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-12-4 16:43:27
Cohen_houston 发表于 2023-10-25 23:48
首先我觉得有一点需要强调一下,一个变量的VIF 高意味着这个变量作为一个predictor对你dependent variable ...
感谢您!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群