全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
9442 7
2015-02-05
本人在做一个OLS多元回归分析,遇到一个问题,具体如下:


被解释变量是:娱乐消费支出
解释变量:2个虚拟变量,分别为居住地(农村=1,城镇=0)、户籍(农业户口=1,非农业户口=0),还有一些社会人口统计变量


主要是想看居住地和户籍这两个体现居民身份的变量对娱乐消费支出的影响是否显著


回归结果显示:居住地指标影响显著,户籍指标影响不显著

之后又加入这两个自变量的交互项后,即居住地*户籍,结果不仅交互项不显著,连居住地指标也变得不显著了,也就是三个指标(居住地、户籍、居住地*户籍)全都不显著了。


真崩溃,这是为什么啊?有办法解决吗?


请教高人!多谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-2-5 19:43:50
居住地和户籍之间存在很大的相关性,加入交互项之后,居住地和交互项共同影响解释变量,但两者之间的很多信息是相同的,并且户籍指标最初并不显著,模型应该存在多重共线性的问题,可以试试逐步回归。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-5 19:47:19
您好,非常感谢!户籍和居住地的相关系数是0.5448,相关性是不是还不算很大?这有关系吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-5 19:56:02
说明交互项影响更大吧,导致其他两个自变量影响太小了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-5 20:21:50
我又用estat vif检测了膨胀因子,

    Variable |       VIF       1/VIF  
-------------+----------------------
rural_a2022|      9.97    0.100336
          rural |      8.09    0.123561
       a2000 |      5.31    0.188345
      labor2 |      3.46    0.289321
  hh_income2 |      2.96    0.338393
       a2022 |      2.82    0.353998
    children |      2.65    0.376956
       a2012 |      2.22    0.449440
loghh_inco~1 |      1.80    0.554655
         age |      1.66    0.601554
  hh_income1 |      1.58    0.631625
       f3001 |      1.42    0.704677
       a3003 |      1.38    0.724700
       house |      1.38    0.726427
       f1001 |      1.28    0.781546
      retire |      1.27    0.784953
      region |      1.26    0.793295
       c7001 |      1.23    0.815005
       e2002 |      1.18    0.848352
       a2015 |      1.17    0.852118
       a2024 |      1.16    0.861458
       f2021 |      1.13    0.883938
     savings |      1.13    0.886929
       a2003 |      1.13    0.887433
   houseloan |      1.08    0.922947
        work |      1.07    0.936633
       f2001 |      1.07    0.937955
  cinsurance |      1.06    0.947651
-------------+----------------------
    Mean VIF |      2.25

第一行是居住地与户籍的交互项,第二行居住地,两个的1/VIF是最低的(0.100336和0.123561),这是不是说明存在多元共线性的问题?怎么解决呢?把交互项做中心化处理吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-5 21:04:41
我把户籍和居住地做了去中心化处理,产生两个新变量:Crural(标准化的居住地)和 Ca2022(标准化的户籍),然后又生成一个新的交互变量:Crural_Ca2022,之后又重新回归,处理结果是Crural显著,Ca2022和Crural_Ca2022不显著。这样处理之后是否就可以了?

哪位高手能帮忙解答一下啊,很着急,谢过了!!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群