huangmosheng 发表于 2015-9-4 09:52
因变量是二分类变量,样本是五年数据,但是五年内有样本是重复的(每年总量本100,有五十个左右重复),控制 ...
我的建议是用面板logit模型。既然有50个样本重复,且审稿专家提到这50个样本组内相关的问题。可考虑单独将这50个重复样本的面板数据单独抽离出来,对其进行组内相关检验(这部分检验可在论坛找陈强老师《高级计量经济学及Stata应用》一书第一版电子版。上面有相关介绍和代码)。不知为什么,我个人感觉你这数据结构有点怪,既有重复多次测量的,又有横截面数据合成的。如果可能,我建议只用50个重复面板数据做分析。祝好运。