进行logistic回归分析的时候,自变量包括个体水平和地区水平,然后尝试了3种分析的方法:1)logistic回归,不包括地区变量;2)logistic回归,将地区变量作为哑变量纳入;3)xtlogit命令进行分析,xtlogit··· ,i(city) or,city表示不同的地区。分析结果如下:
| antechk5r | antechk5r | antechk5r |
| b1 | b2 | b3 |
| survey2 | 1.191 | 1.349 | 1.333 |
| urban | 3.045*** | 5.781*** | 5.610*** |
| turban | 0.393*** | 0.202*** | 0.218*** |
| biragegr2 | 1.807 | 1.759 | 1.772 |
| biragegr3 | 1.828 | 1.827 | 1.832 |
| biragegr4 | 1.484 | 1.397 | 1.414 |
| pone | 1.226 | 1.417* | 1.405* |
| ncd | 0.913 | 0.831 | 0.834 |
| hanmajor | 0.355*** | 0.456** | 0.447*** |
| marital | 1.342 | 1.762 | 1.719 |
| edugr2 | 2.196 | 3.081** | 3.051** |
| edugr3 | 2.241 | 3.208* | 3.161* |
| edugr4 | 2.334 | 4.190** | 4.019** |
| job | 1.115 | 1.058 | 1.057 |
| incomegr2 | 1.307 | 1.408* | 1.392* |
| incomegr3 | 1.346 | 1.602** | 1.568* |
| incomegr4 | 1.324 | 1.418 | 1.406 |
| incomegr5 | 1.782** | 1.737* | 1.741* |
| cleanwater | 1.284 | 0.736 | 0.754 |
| hygtoilet | 0.743* | 0.863 | 0.85 |
| htimegr | 0.449*** | 0.452*** | 0.458*** |
| nocover | 0.559*** | 0.589** | 0.582** |
| city2 | | 4.229*** | |
| city3 | | 0.701 | |
| city4 | | 5.915*** | |
| city5 | | 2.155** | |
| city6 | | 0.225*** | |
| city7 | | 0.659 | |
| city8 | | 3.944*** | |
| city9 | | 3.060*** | |
上面结果可以看到,xtlogit和将地区变量作为哑变量进行分析得到的结果是很相似的,而它们都与不纳入地区变量的分析结果差别较大。
我想问的是:1)在呈现上述结果的时候,是否应该选择xtlogit的结果,或者是考虑地区变量的结果,而不是没有考虑地区变量的结果,即应用b2和b3,不用b1;2)选择使用b2还是b3是不是有差别呢,b2可以看到各地区之间的具体差异,b3是否可以呢?