全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
2921 1
2015-02-16
足球裁判的偏袒问题主要文献中通过各种模型的比较使用了zinb,可是13页的regression不是很明白是怎么来的。
利用自己找来的数据,想模仿这样的做法,可是用
. nbreg HDP hqj uncertainty att,nolog 得到的结果这样的alpha值是不用做zinb了么 HDP=主队纪律分 hqj=主队胜率+0.5平概率 uncertainty=不确定因素=hqj(1-hqj)  att=上座/1,000
如果要做zinb,我应该inflate哪个变量呢。。。
Negative binomial regression                      Number of obs   =        760
                                                  LR chi2(3)      =      12.35
Dispersion     = mean                             Prob > chi2     =     0.0063
Log likelihood = -1185.0079                       Pseudo R2       =     0.0052

------------------------------------------------------------------------------
         HDP |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         hqj |   .2537806   .0965307     2.63   0.009     .0645838    .4429773
uncertainty |   .0177232   .0080406     2.20   0.028     .0019639    .0334825
         att |  -.0017214   .0022467    -0.77   0.444    -.0061248     .002682
       _cons |  -.3615246   .3147861    -1.15   0.251    -.9784941    .2554449
-------------+----------------------------------------------------------------
    /lnalpha |  -3.146214   .8675265                     -4.846535   -1.445893
-------------+----------------------------------------------------------------
       alpha |   .0430147   .0373164                      .0078556    .2355356
------------------------------------------------------------------------------
Likelihood-ratio test of alpha=0:  chibar2(01) =    1.47 Prob>=chibar2 = 0.112
实在是不明白,求助各位大神。万分感谢。
附件列表
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2024-11-6 16:36:31
在使用零膨胀负二项回归(Zero-Inflated Negative Binomial Regression,简称ZINB)模型时,通常是因为数据中存在大量的零值,并且这些零值不仅仅是由负二项分布产生的随机零,还可能包含有额外的“结构性”零。也就是说,在你的数据集中,“HDP=主队纪律分”的变量可能存在很多情况下为0的情况,这可能是由于某些比赛中没有发生需要记分的违规事件,而不是由负面二项式过程本身生成的。

在使用ZINB模型时,你实际上是拟合两个模型:一个用于预测非零观测值的发生概率(也就是“inflation”模型),另一个用于描述非零观测值的分布。因此,在你的案例中:

1. 首先确认HDP变量中有大量的0值,并且这些0值有其特别的意义(比如,它们代表了没有违规行为发生的情况)。

2. 使用ZINB模型时,你需要指定一个“inflation”方程,该方程将解释为什么某些观测的HDP为零。这可能与比赛性质、裁判偏好、球队策略等因素有关。

例如,在Stata中使用ZINB模型可以这样操作:

```
zinb HDP hqj uncertainty att, inflate(hqj uncertainty att)
```

这里的`inflate()`选项中的变量用于预测结构性0值,即为什么某些比赛的HDP为零。你可以选择与“HDP=主队纪律分”相关的因素放入inflate方程中,这些可能包括hqj(主队胜率)、uncertainty(不确定性)以及att(上座数/1,000)等。

在解释模型时,`nbreg`命令给出的alpha值用于衡量数据的过度分散程度。如果alpha显著大于零,则说明负二项分布比泊松分布更合适,因为数据中存在过度分散。但这并不意味着你不能使用ZINB模型;即使alpha不为0,如果你的数据中有很多零值,并且这些零有额外的信息(不仅仅是随机产生的),那么ZINB依然是一个值得考虑的模型。

希望这能帮助你理解如何在你的研究中应用ZINB模型!如果有更具体的问题或需要进一步的帮助,请随时提问。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群