全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
20998 5
2013-01-18
在做回归分析时发现一个问题,因变量y有缺失值,如果不用drop y==.命令,回归后vif检验小于10,如果采用drop y==.命令,回归后vif检验值一下子蹦到了27,在这两种处理方式的回归中,最后样本数是相同的,回归系数、显著性也相同,为啥就是vif检验值差异这么大?一定要用drop命令吗?求高手解惑!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-1-18 15:20:19
结果都列出来
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-1-18 15:31:01
drop if Lsize==.
(285 observations deleted)

.
. drop if Llever==.
(0 observations deleted)

.
. drop if Leps==.
(2 observations deleted)

.
. drop if Lroa==.
(0 observations deleted)

.
. drop if Lvar6==.
(0 observations deleted)

.
. drop if Ltop1==.
(18 observations deleted)

.
. drop if Ltop1H==.
(0 observations deleted)

. reg y3_w eva Lsize Llever Ltop1 Lvar6 Lroa dummy* ind*
note: dummy_year1 omitted because of collinearity
note: dummy_year3 omitted because of collinearity
note: dummy_year4 omitted because of collinearity

      Source |       SS       df       MS              Number of obs =     816
-------------+------------------------------           F( 20,   795) =   15.79
       Model |  67.4817988    20  3.37408994           Prob > F      =  0.0000
    Residual |  169.835506   795  .213629567           R-squared     =  0.2844
-------------+------------------------------           Adj R-squared =  0.2663
       Total |  237.317304   815  .291186877           Root MSE      =   .4622

------------------------------------------------------------------------------
        y3_w |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         eva |   .1014824   .0480688     2.11   0.035     .0071256    .1958392
       Lsize |   .0162834   .0129044     1.26   0.207    -.0090473    .0416141
      Llever |    .187753   .1001571     1.87   0.061    -.0088507    .3843566
       Ltop1 |   .0009084   .0010996     0.83   0.409    -.0012501    .0030669
       Lvar6 |  -.1174136   .0351044    -3.34   0.001    -.1863219   -.0485054
        Lroa |   .7766917   .3232493     2.40   0.016     .1421687    1.411215
dummy_year1 |  (omitted)
dummy_year2 |     .12921    .047315     2.73   0.006     .0363328    .2220872
dummy_year3 |  (omitted)
dummy_year4 |  (omitted)
dummy_year5 |   -.008149   .0455784    -0.18   0.858    -.0976172    .0813192
        ind1 |   .8428586    .493702     1.71   0.088    -.1262549    1.811972
        ind2 |   .7496884   .4724156     1.59   0.113     -.177641    1.677018
        ind3 |   .8836472   .4685505     1.89   0.060    -.0360952     1.80339
        ind4 |   .4068626   .4688917     0.87   0.386    -.5135494    1.327275
        ind5 |   .9684326   .4728461     2.05   0.041     .0402583    1.896607
        ind6 |   .4953194   .4716948     1.05   0.294    -.4305949    1.421234
        ind7 |   1.077065   .4718224     2.28   0.023     .1509003     2.00323
        ind8 |   1.848819   .4748201     3.89   0.000     .9167697    2.780868
       ind10 |   .3335956    .477383     0.70   0.485    -.6034844    1.270676
       ind11 |   .7337075   .4803441     1.53   0.127     -.209185      1.6766
       ind12 |   .5020386   .5429553     0.92   0.355    -.5637568    1.567834
       ind13 |   .7003385   .5223324     1.34   0.180    -.3249752    1.725652
       _cons |  -.6530311    .569848    -1.15   0.252    -1.771616    .4655534
------------------------------------------------------------------------------

. vif

    Variable |       VIF       1/VIF  
-------------+----------------------
        ind3 |     29.16    0.034289
        ind4 |      9.64    0.103700
        ind7 |      9.37    0.106735
        ind6 |      7.06    0.141720
        ind2 |      6.38    0.156721
        ind8 |      5.43    0.184221
        ind5 |      5.06    0.197688
       ind11 |      3.81    0.262507
       ind10 |      3.58    0.279331
        ind1 |      2.22    0.451436
         eva |      2.17    0.461837
       Lsize |      1.72    0.581102
       ind13 |      1.68    0.596670
      Llever |      1.57    0.637398
dummy_year5 |      1.54    0.648712
dummy_year2 |      1.54    0.650595
       ind12 |      1.48    0.675563
       Ltop1 |      1.47    0.679641
        Lroa |      1.37    0.732279
       Lvar6 |      1.10    0.908381
-------------+----------------------
    Mean VIF |      4.87

. drop if y3_w==.
(212 observations deleted)

. reg y3_w eva Lsize Llever Ltop1 Lvar6 Lroa dummy* ind*
note: dummy_year1 omitted because of collinearity
note: dummy_year3 omitted because of collinearity
note: dummy_year4 omitted because of collinearity

      Source |       SS       df       MS              Number of obs =     816
-------------+------------------------------           F( 20,   795) =   15.79
       Model |  67.4817988    20  3.37408994           Prob > F      =  0.0000
    Residual |  169.835506   795  .213629567           R-squared     =  0.2844
-------------+------------------------------           Adj R-squared =  0.2663
       Total |  237.317304   815  .291186877           Root MSE      =   .4622

------------------------------------------------------------------------------
        y3_w |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         eva |   .1014824   .0480688     2.11   0.035     .0071256    .1958392
       Lsize |   .0162834   .0129044     1.26   0.207    -.0090473    .0416141
      Llever |    .187753   .1001571     1.87   0.061    -.0088507    .3843566
       Ltop1 |   .0009084   .0010996     0.83   0.409    -.0012501    .0030669
       Lvar6 |  -.1174136   .0351044    -3.34   0.001    -.1863219   -.0485054
        Lroa |   .7766917   .3232493     2.40   0.016     .1421687    1.411215
dummy_year1 |  (omitted)
dummy_year2 |     .12921    .047315     2.73   0.006     .0363328    .2220872
dummy_year3 |  (omitted)
dummy_year4 |  (omitted)
dummy_year5 |   -.008149   .0455784    -0.18   0.858    -.0976172    .0813192
        ind1 |   .8428586    .493702     1.71   0.088    -.1262549    1.811972
        ind2 |   .7496884   .4724156     1.59   0.113     -.177641    1.677018
        ind3 |   .8836472   .4685505     1.89   0.060    -.0360952     1.80339
        ind4 |   .4068626   .4688917     0.87   0.386    -.5135494    1.327275
        ind5 |   .9684326   .4728461     2.05   0.041     .0402583    1.896607
        ind6 |   .4953194   .4716948     1.05   0.294    -.4305949    1.421234
        ind7 |   1.077065   .4718224     2.28   0.023     .1509003     2.00323
        ind8 |   1.848819   .4748201     3.89   0.000     .9167697    2.780868
       ind10 |   .3335956    .477383     0.70   0.485    -.6034844    1.270676
       ind11 |   .7337075   .4803441     1.53   0.127     -.209185      1.6766
       ind12 |   .5020386   .5429553     0.92   0.355    -.5637568    1.567834
       ind13 |   .7003385   .5223324     1.34   0.180    -.3249752    1.725652
       _cons |  -.6530311    .569848    -1.15   0.252    -1.771616    .4655534
------------------------------------------------------------------------------

. vif

    Variable |       VIF       1/VIF  
-------------+----------------------
        ind3 |    202.93    0.004928
        ind7 |     64.96    0.015395
        ind4 |     63.29    0.015800
        ind6 |     42.42    0.023571
        ind2 |     37.85    0.026420
        ind8 |     34.39    0.029081
        ind5 |     30.24    0.033065
       ind10 |     19.80    0.050513
       ind11 |     19.01    0.052598
        ind1 |     11.27    0.088733
       ind13 |      5.08    0.196717
       ind12 |      4.12    0.242444
         eva |      2.20    0.454003
      Llever |      1.73    0.578040
       Lsize |      1.62    0.616391
dummy_year2 |      1.56    0.640775
dummy_year5 |      1.52    0.657349
       Ltop1 |      1.50    0.664549
        Lroa |      1.46    0.685420
       Lvar6 |      1.11    0.901981
-------------+----------------------
    Mean VIF |     27.40
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-1-18 15:34:19
两次回归变量都一致,区别就在第二次回归前用了drop y3_w命令,但我理解的是,虽然第一次回归未对y3_w进行drop,实际回归时样本仍是未考虑y3_w==.的,所以想不明白为何vif检验差异会如此之大。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-1-21 12:37:22

. sysuse auto,clear
(1978 Automobile Data)

. replace price=.   in 1/12
(12 real changes made, 12 to missing)

. reg price mpg headroom weight length

      Source |       SS       df       MS              Number of obs =      62
-------------+------------------------------           F(  4,    57) =    8.44
       Model |   184081086     4  46020271.5           Prob > F      =  0.0000
    Residual |   310942961    57  5455139.66           R-squared     =  0.3719
-------------+------------------------------           Adj R-squared =  0.3278
       Total |   495024047    61  8115148.31           Root MSE      =  2335.6

------------------------------------------------------------------------------
       price |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         mpg |  -103.8494   83.52006    -1.24   0.219    -271.0955    63.39659
    headroom |   -511.539    402.951    -1.27   0.209    -1318.435    295.3565
      weight |    4.69424    1.27251     3.69   0.001     2.146083    7.242397
      length |  -118.1443   46.69946    -2.53   0.014    -211.6584   -24.63024
       _cons |   17986.93   6630.417     2.71   0.009     4709.746    31264.11
------------------------------------------------------------------------------

. estat vif

    Variable |       VIF       1/VIF  
-------------+----------------------
      length |     12.36    0.080908
      weight |     11.22    0.089111
         mpg |      2.80    0.356921
    headroom |      1.33    0.753352
-------------+----------------------
    Mean VIF |      6.93

. drop if price==.
(12 observations deleted)

. reg price mpg headroom weight length

      Source |       SS       df       MS              Number of obs =      62
-------------+------------------------------           F(  4,    57) =    8.44
       Model |   184081086     4  46020271.5           Prob > F      =  0.0000
    Residual |   310942961    57  5455139.66           R-squared     =  0.3719
-------------+------------------------------           Adj R-squared =  0.3278
       Total |   495024047    61  8115148.31           Root MSE      =  2335.6

------------------------------------------------------------------------------
       price |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         mpg |  -103.8494   83.52006    -1.24   0.219    -271.0955    63.39659
    headroom |   -511.539    402.951    -1.27   0.209    -1318.435    295.3565
      weight |    4.69424    1.27251     3.69   0.001     2.146083    7.242397
      length |  -118.1443   46.69946    -2.53   0.014    -211.6584   -24.63024
       _cons |   17986.93   6630.417     2.71   0.009     4709.746    31264.11
------------------------------------------------------------------------------

. estat vif

    Variable |       VIF       1/VIF  
-------------+----------------------
      length |     12.36    0.080908
      weight |     11.22    0.089111
         mpg |      2.80    0.356921
    headroom |      1.33    0.753352
-------------+----------------------
    Mean VIF |      6.93

.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-1-21 12:38:20
我这里没有问题

检查软件是否升级
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群