2012年6月,西南财经大学“中国家庭金融调查与研究中心”发布了《中国家庭金融调查报告》 (以及后来的工作论文《中国家庭收入不平等报告》),认为我国2010年收入的基尼系数达到了0.61(甘犁等,2012)。这一数据在社会和学术界都产生了一定的轰动效应,也引起了很大的争议。
按照《中国家庭金融调查报告》(以下简称“报告”)的测算,2010年的基尼系数已超过了0.61。然而,我们“收入分配课题组”从1988年就开始长期跟踪测算中国的基尼系数,最近一次测算的2007年全国基尼系数仅为0.48。 也就是说,如果认同“报告”所估计的结果,那么就会得出两种推论。一种推论是在短短的3年内中国的收入差距出现了迅速扩大,另一种推论是我们的估计结果是显著偏低了。然而,我们认为这两种推论都很难成立。
先谈后一种推论。首先,从样本量来说,我们的调查比“报告”所使用的样本要大得多,“报告”的估计结果是基于8000个住户样本,我们是28000个住户样本,而且样本具有很强的代表性。其次,从样本质量上来说,我们的数据是有较高程度地质量保证的,因为这些调查户被要求对每天的收入和支出情况进行记账,因而收入和支出的信息比较可靠。再次,在估计收入差距时,我们对不同类型样本户根据城乡、地区人口比例分别进行加权。最后,考虑到各种估计误差可能带来的影响,我们还根据国际上使用的收入概念对收入进行了调整。总体上说,我们的估计结果得到了大多数学者的认同,现在国内外学术界和媒体普遍引用的中国当前的基尼系数就是来自我们的估计结果。
而对于前一种推论(即在2007年至2010年期间收入差距迅速扩大),它也是很难成立的。虽然2007年以后我们没有做全国的住户收入调查,但是从其他方面获得的一些信息也可以对这个推论作一个大致的判断。从统计局公布的数据来看,2007年以后几年城镇内部收入差距略有扩大,而农村内部收入差距小幅波动,2010年相对于2009年还略有下降;另外,城乡之间收入差距在2009年达到最大,2010年后也略有缩小(国家统计局,2012)。
总的来说,我们不能接受上述两个推论,所以就不得不质疑 “报告”所估计的结果。本文认为,“中国家庭金融调查与研究中心”估计的中国收入差距数据存在着诸多问题,其计算的全国基尼系数存在严重的高估问题。本文拟从学术的角度就西南财经大学发布的《中国家庭金融调查报告》中有关收入差距的估计结果进行评述,并从抽样方案和问卷设计上探讨其基尼系数被高估的具体原因。一般来说,基尼系数被高估的原因无非有两大类:一类是,不同收入样本的代表性不匹配;另一类是不同收入群体的收入存在估计偏差。而我们认为,这两类问题在“报告”中都随处可见,现具体说明如下。
2 抽样方法与数据结构问题2.1 抽样方法问题2.1.1 按非农人口比例排序抽样会导致全国收入差距高估根据“报告”的抽样方案,在第二阶段,“报告”按非农人口比例的高低顺序排列并抽取居委会(村委会),而这会导致严重的样本偏差,因为中等收入组的样本比例会偏低,而高低两端的样本则过于偏高。
具体来说,按照“报告”第二阶段的抽样规则,先把居委会(村委会)按非农人口比例从高到低排列并分成五组。同时,要求在非农最高比例的居委会(村委会)不抽取农村样本,而在非农最低比例的居委会(村委会)也不抽取城市样本。这样导致的结果就是,非农比例高的东部地区抽取了较少的农村样本和较多的城市样本;同样,非农比例较低的西部地区则抽取了较多的农村样本,而城市样本较少。即高收入和低收入样本过多,而中等收入样本过少(东部城市和西部农村样本过多,东部农村和西部城市样本过少)。换句话说,就是在富裕群体中抽了富裕的部分,而在贫穷群体中又抽取了贫穷的部分,处于收入分布两端的样本都被过度抽取了,而中间收入群体的样本过少,这就显著地拉大了全国的收入差距水平。
2.1.2 “喜富嫌贫”式抽样方法导致收入差距被高估因为“报告”最初的研究目的在于收集家庭财产方面的信息,而穷人拥有的财产很少。所以,“报告”一开篇就明确要求要尽量抽取富裕地区的样本。在第一阶段抽样中,他们就按收入指标而不是省份等地理指标来分层抽取80个市(县)。而在第三阶段抽样中,这种方法在收集富人样本的措施上也做到了极致。首先,他们莫名其妙地在城乡样本划分上,先验地在农村村委会统一只抽取20户,而给城市居委会则抽取25-50户之多。更重要的是,在城市居委会中,为了得到更多的富裕人群,他们按每个社区的住房价格进行4级排序,同时给住房价格最低的组分配25户样本,其次是30户,再次是35户,而到了住房价格最高的组却直接跳至50户样本之多。这样的结果就是极大地提高了最高收入组的样本比例。
综合来看,他们首先在城乡样本分配的阶段就已经“喜富嫌贫”,导致了样本结构偏向于城市样本;之后,在城市样本内部的分布中也是严重的不均衡,最高收入组被人为地分配了过多的样本。所以,这些抽样方法都导致了样本结构的严重倾斜,形成了一个过高比例的高收入群体和过低比例的中等收入群体,也就直接拉大了全国的收入差距水平。
扫码加好友,拉您进群



收藏
