全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
9107 2
2015-03-19
有几个问题想请教下大家:1.面板数据,总共14万条记录,但y=1的记录只有1100多条,其他的都是使y=0的,我感觉其结果会被稀释很多。所以用起来有点担心。发生的算是稀有事件了,但又是面板数据,感觉有点无措。
2.采用混合probit回归,但是出现了Note: 16 failures and 0 successes completely determined.,我也上stata网上查了下,我是那里提出的情况中的第一种,应该问题不大。但是R^2实在太小了只有0.0557,所以有点慌了,Log likelihood = -6157.0573 ,但是,就估计结果而言,只有常数项z值小,0.65,但我还是感觉会不会有问题。所以我用了下面的方法
3.因为是初学者,我暂时还不太会用xtlogit,而且xtlogit固定效应算出的很多变量z值都很低(原则上是不是都比较青睐于使用固定效应模型,但是xtlogit效果不行),所以我试着采用xtprobit随机效应模型,
xtprobit var1 ex1  ex2 ex3 ex4 ertat entrance randd lncap,nolog

Random-effects probit regression                Number of obs      =    142591
Group variable: newid1                          Number of groups   =     72997

Random effects u_i ~ Gaussian                   Obs per group: min =         1
                                                               avg =       2.0
                                                               max =         3

Integration method: mvaghermite                 Integration points =        12

                                                Wald chi2(8)       =    181.21
Log likelihood  =  -4007.311                    Prob > chi2        =    0.0000

------------------------------------------------------------------------------
        var1 |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         ex1 |   .1824436   .0472319     3.86   0.000     .0898707    .2750165
         ex2 |  -.5675857   .0982919    -5.77   0.000    -.7602342   -.3749371
         ex3 |   .1380591   .0264527     5.22   0.000     .0862128    .1899054
         ex4 |   .3008444   .0469112     6.41   0.000        .2089    .3927887
       ertat |  -11.61345   2.941699    -3.95   0.000    -17.37908   -5.847826
    entrance |  -.6560081   .7093972    -0.92   0.355    -2.046401     .734385
       randd |   2.081939   1.066982     1.95   0.051    -.0093068    4.173184
       lncap |   .1213522   .0348979     3.48   0.001     .0529535    .1897509
       _cons |   17.72977   7.954497     2.23   0.026     2.139242     33.3203
-------------+----------------------------------------------------------------
    /lnsig2u |   2.654405   .0165727                      2.621923    2.686887
-------------+----------------------------------------------------------------
     sigma_u |   3.770481   .0312436                      3.709739    3.832217
         rho |    .934282   .0010176                      .9322593    .9362484
------------------------------------------------------------------------------
Likelihood-ratio test of rho=0: chibar2(01) =  4403.18 Prob >= chibar2 = 0.000

最后一行LR检验结果是不是可以说明比较适合使用随机效应面板probit回归。

我想请问第一,我数据的问题,是不是适合使用这个模型,第二,撇开混合效应是否有效的问题,我直接probit出的结果,R^2小和常数项z值小会不会问题很大(可能以后还会遇到这样的问题,所以想顺便请教下),第三,随机效应的面板probit,大家看看是否有问题,我不是很确定,一边继续查些文献,一边请教下大家。问题有点多,希望能听听大家的意见和建议,非常感谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-3-20 08:51:10
0值数据过多的话,尝试一下ppml
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-3-20 10:47:21
ryangryang 发表于 2015-3-20 08:51
0值数据过多的话,尝试一下ppml
好的,谢谢,我试了下,有两个之前不显著的变量被警告has very large values, consider rescaling or recentering,出现了The model appears to overfit some observations ,我暂时先删了,做了下拟泊松分布,

Number of parameters: 7
Number of observations: 136522
Number of observations dropped: 0
Pseudo log-likelihood: -6125.7399
R-squared: .00763631
------------------------------------------------------------------------------
             |               Robust
        var1 |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         ex1 |   .2174468   .0319918     6.80   0.000     .1547439    .2801496
         ex2 |   -.491724   .0675581    -7.28   0.000    -.6241355   -.3593125
         ex4 |   .4085914   .0268349    15.23   0.000      .355996    .4611868
       ertat |  -6.409261   3.281177    -1.95   0.051    -12.84025    .0217277
       randd |   1.357963   .2502963     5.43   0.000     .8673909    1.848534
       lncap |   .0905446   .0217956     4.15   0.000     .0478261    .1332631
       _cons |   8.535136   8.871117     0.96   0.336    -8.851934    25.92221
------------------------------------------------------------------------------
Number of regressors dropped to ensure that the estimates exist: 0
Option strict is off
感觉r方还是很小,常数项还是不显著,虽然查了下,一些人说常数项不显著也不影响,之前检验过解释变量相关性,感觉也还可以,所以我不太确定造成以上问题的原因是我样本中零值过多,还是遗漏重要解释变量。所以有点麻烦
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群