在一篇很热闹的帖子里看到了大家讨论复旦大学几位前辈的文章。既然谈到了,我们还是看看文章本身,不要盲从。
我随机搜索了一篇2004年发表在经济研究上论文《城市化、城市倾向的经济政策与城乡收入差距》,就事论事,不针对文章作者和所在机构以及刊出文章的期刊。
我们看这篇文章的IV设计是不是有问题。它的模型主要是看非农人口比例与城乡收入差别的关系。暂且不论非农人口比例是否可以完全代表城市化水平,我们主要看用滞后一期的出生率作非农人口比例的IV是否合理。按照一个基本原则,IV和自变量相关,与应变量无关(这里是简单说法,不是严格定义)。上一期的出生率与非农人口有关,所以第一个条件满足。那么上一期出生率与本期城乡收入差别有关系么?
上期出生率与城乡差异之间可能存在的关系如下(是可能,没有严格论证,只是理论上可以被质疑):
1.出生率高的地区,可能是因为经济条件较好(可能,不是肯定),所以间接地,高出生率的地区比低出生率的地区收入水平要高。
2. 反过来说,更符合中国农村现实的是,低收入地区出生率高,这样出生率依然和城乡差距有关系。
无论哪一种情况都可以导致IV出问题。
他们用hausmen检验值说明在IV-FE的模型中,城市化没有内生性问题。
原文如下:
”第一,在固定效应估计中,城市化显著地降低城乡收入差距,但在固定效应工具变量估计结果则显示城市化对城乡收入差距影响增大,同时显著性有所降低,不过Hausman 检验结果不支持城市化指标具有内生性问题。“
“通过对于1987-2001年间省级面板数据的分析,并且考虑了城市化指标的内生性问题之后,我们发现,城市化缩小城乡收入差距的作用显著。“
这两段话,一段出自结果的分析,一段出自最后总结。稍微有点逻辑的读者就会发现,这里有矛盾。说得客气一点是论证不充分不严谨,说得不客气一点就是糊弄读者。要么是IV不适当,要么是hausman检验出了纰漏,如果两者都不是,那总得有一个技术上和现实上都可以说得通的解释。
起码作为严谨的学术文章和学术期刊应该重视细节,不要太草率。。比较令人担忧的不是文章有瑕疵,而是大家对此的看法。
任何学术文章都可能有问题,有需要改进的地方,哪怕是国际顶级期刊的论文都可以挑出毛病来,这一点不奇怪。可是,国内的某些人和机构对明显的问题视而不见,这就不太好了。
PS 我说话算是比较客气的,如果这样的文章我交给自己导师,那肯定直接被扔到垃圾桶里去。
我绝对不怀疑作者的学术水平,这是由衷的。从他们辉煌的履历和发表过的重量级刊物,从海外名校访问交流的经历到参与过的重点项目,我绝对相信作者们在学术上比我们很多人高出一大截。但我想说的是,什么时候我们可以只看文章内容,不看作者简历和头衔来讨论就好了。