全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
4502 3
2015-11-22
因变量为二分类变量,个体水平变量包括教育、就业等,有地区id。用两种分析方法:1)将地区作为哑变量纳入logistic回归,这样分析发现存在地区差异
2)进行二层次logistic回归,stata中命令为:"melogit y x1 x2... || citynum:,or" 这里citynum就是地区id
这两种方法得到的结果如下:
方法1:
Logistic regression        Number of obs        =        1051
                                LR chi2(30)        =        231.66
                               Prob > chi2        =        0.0000
Log likelihood = -581.91416        Pseudo R2        =        0.1660


bci95
survey21.349[0.882,2.064]
urban5.781***[2.827,11.824]
turban0.202***[0.098,0.417]
biragegr21.759[0.771,4.011]
biragegr31.827[0.797,4.189]
biragegr41.397[0.540,3.612]
pone1.417*[0.950,2.111]
ncd0.831[0.369,1.869]
hanmajor0.456**[0.249,0.837]
marital1.762[0.500,6.213]
edugr23.081**[1.021,9.300]
edugr33.208*[0.967,10.646]
edugr44.190**[1.218,14.410]
job1.058[0.688,1.626]
incomegr21.408*[0.953,2.082]
incomegr31.602**[1.002,2.563]
incomegr41.418[0.891,2.256]
incomegr51.737*[0.967,3.121]
cleanwater0.736[0.449,1.206]
hygtoilet0.863[0.610,1.221]
htimegr0.452***[0.296,0.688]
nocover0.589**[0.374,0.926]
city24.229***[2.160,8.279]
city30.701[0.390,1.260]
city45.915***[1.735,20.164]
city52.155**[1.137,4.082]
city60.225***[0.108,0.472]
city70.659[0.332,1.307]
city83.944***[2.065,7.532]
city93.060***[1.332,7.030]
Constant0.274[0.056,1.343]


方法2:
Mixed-effects logistic regression        Number of obs        =        1051
Group variable:   citynum                    Number of groups=        9
Obs per group: min        =        28
avg        =        116.8
max        =        192

Integration method: mvaghermite        Integration points        =        7
Wald chi2(22)        =        84.73
Log likelihood = -599.58982        Prob > chi2        =        0.0000

bci95
survey21.333[0.874,2.034]
urban5.610***[2.784,11.305]
turban0.218***[0.106,0.446]
biragegr21.772[0.778,4.037]
biragegr31.832[0.800,4.196]
biragegr41.414[0.548,3.645]
pone1.405*[0.945,2.089]
ncd0.834[0.373,1.867]
hanmajor0.447***[0.244,0.816]
marital1.719[0.490,6.030]
edugr23.051**[1.013,9.188]
edugr33.161*[0.956,10.457]
edugr44.019**[1.173,13.771]
job1.057[0.689,1.622]
incomegr21.392*[0.944,2.052]
incomegr31.568*[0.983,2.501]
incomegr41.406[0.886,2.232]
incomegr51.741*[0.972,3.120]
cleanwater0.754[0.463,1.229]
hygtoilet0.85[0.602,1.201]
htimegr0.458***[0.302,0.694]
nocover0.582**[0.371,0.912]
Constant0.441[0.083,2.353]
var(_cons[citynum])0.945095
Constant2.573*[0.976,6.781]

LR        test        vs.        logistic        regression:        chibar2(01)        =        104.93        Prob>=chibar2        =        0.0000

问题:
1)上面两种方法得到的结果比较相近,其主要的区别是不是方法1其实把地区的效应固定了,方法2把地区作为随机效应控制了?
2)从这个结果来看的话,具体该怎么判断哪种方法更加合适呢?



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-11-23 07:32:27
phwangying 发表于 2015-11-22 23:45
因变量为二分类变量,个体水平变量包括教育、就业等,有地区id。用两种分析方法:1)将地区作为哑变量纳入l ...
有时方法结果类似,就主要取决于你具体想解决什么问题了。一般文献中的方法是将地区作为控制变量加入模型。不过在教育学,心理学等领域又用层次线性模型比较多。所以,综合而言,看要解决什么问题的。看地区变量是不是你重点关注的变量。祝好运~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-11-23 08:15:03
同意楼上,方法服务于故事,如果你的故事为了突出地区之间因果关系的系统差异,多层次或多水平分样本的回归更有说服力,更具有解释力。如果你的因果关系识别是研究重点的话,地区作为控制变量控制即可
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-11-23 11:00:21
感谢二位~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群