悬赏 2 个论坛币 未解决
本人正在做关于企业的实证论文, 其中城市虚拟变量120个,行业虚拟变量31个, 如果把他们都包含在回归中, 一方面原来很显著的某些重要解释变量变得不显著,另一方面通过求VIF发现, 很多虚拟变量的VIF大于10, 说明这些虚拟变量会导致多重共线性,那这种情况如何处理, 不控制的话好像不够严谨,全控制又会导致上述问题,那么该如何处理呢?我的一个想法是重新分组,比如把120个城市虚拟变量分成30个省虚拟变量,这样会大大减少虚拟变量的个数,缓解上述问题,不知道这种方法可以吗?谢谢!