全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 真实世界经济学(含财经时事)
19165 35
2012-12-28
楼主的说明:当前收入差距问题刺激每个人的神经,正常人都会承认当前收入差距太大了。这也引起一些学者靠发布一些不靠谱的结果来吸引眼球。从学术科研上说,随意的估计结果没有学术价值,只是一次次刺激着大家神经,但没有实在价值。本文和李实教授、罗楚亮教授的评述旨在说明西财估计结果的不合理性,并不反对当前收入差距过大的事实。


参考:
李实:为什么基尼系数会高估?  [在本论坛的帖子]
罗楚亮:对《中国家庭收入不平等报告》的评论 [在本论坛的帖子]


原文转自:岳希明:西南财经大学0.61基尼系数不可信!——中国收入分配研究院
1、调查结果的诸多疑点
西南财经大学中国家庭金融调查与研究中心最新公布了《中国家庭收入不平等报告》(以下简称“报告”,“报告”所依据的住户调查以下简称“调查”),报告显示,2010年中国家庭收入基尼系数为0.61,城镇家庭内容基尼系数为0.56,农村家庭内部基尼系数为0.60。这些估计值是迄今为止根据住户调查数据得到的中国居民收入基尼系数的最高估计值,因此得到社会各界的普遍关注。
但是,非常遗憾的是,“报告”中的收入水平和收入差距有诸多可疑之处,对此列举如下:
第一,“报告”给出的全国0.61的基尼系数本身具有很大的任意性。在计算基尼系数时,“报告”“将收入小于0的家庭去掉,同时去除最高和最低收入的1%的家庭。”如果不去掉极端样本时,基尼系数比0.61更大。但是,对于为何必须去掉这些样本,为何必须是收入最高和最低1%的样本,而不是5%的样本,“报告”没有给出令人信服的解释。这让“报告”中0.61估计值带有很大随意性。如果“报告”相信其调查数据是可信的话,显然没有必要去掉收入为负数,以及低收入和高收入样本。
第二,“报告”低估了低收入人口的收入。中国家庭金融调查与研究中心在一份英文资料中给出了城镇有25%的居民家庭年收入在6420元以下,农村有25%的居民家庭年收入在4294元以下的计算结果。一位网友指出(长溪岭,2012),这一结果意味着,“在2010年,中国城镇居民家庭四户中有一户的人均月收入在200元以下,即每天约为6元以下,农村中四户中有一户的人均月收入在100元以下,即每天3元钱以下。这意味着中国有四分之一家庭濒于或正处于饥饿状态中。”这种低收入显然不现实的。
第三,“报告”给出的基尼系数明显高估中国居民收入差距。这一点从比较“报告”的农村基尼系数和国家统计局的相应估计可知。国家统计局公布的2011年农村人均纯收入基尼系数为0.3897。以家庭为单位(而不是人均值)计算的话,农村人均纯收入的基尼系数会更低一些,因为低收入家庭的人口数较多。这一估计值远远地区“报告”的0.60的基尼系数。
在国家统计局的住户调查中,由于高收入样本的不足和缺失,城镇样本有一定的偏差,由此得到居民收入不平等程度估计值会低估。但是这一问题在农村样本中基本不存在,无论从样本的代表性,还是从收入的定义和收集上,农村样本均不存在系统性偏差,因此从农村样本得到的估计值基本是可信的。
第四,从西南财经大学中国家庭金融调查与研究中心公布的英文PPT可知,家庭可支配收入的平均值和中位数,城镇分别是70 876元和28 800元,农村分别是22 278元和10 580元,均值与中位数的比例,城镇为2.46,农村为2.11。在收入分布上,大部分住户通常聚集在均值以下,因此中位数要小于均值。均值和中位数之间的差距在某种程度上反映住户收入的分散程度。由于缺少2010年国家统计局相应数据,我们用2007年国家统计局农村样本计算农村家庭纯收入(以家庭为单位)均值、中位数以及前者对后者的比率,结果分别是18 422元、15 000元和1.23。考虑到2007-2010年农村人均纯收入基尼系数虽然由0.3742上升至到0.3783,但并不是非常显著,因此可以说,“报告”中2.11的农村可支配收入均值和中位数之比高估了农村住户的收入差距。

2、“调查”的样本问题
“报告”对收入水平及其分散估计值之所以出现系统性偏差,主要原因在于样本的偏差。仔细观察《CHFS抽样调查设计说明》不难发现,“调查”的抽样过程明显存在向高收入群体倾斜的偏差,以及高估收入差距的偏差。“调查”采取了三阶段PPS抽样方法,抽样的第一阶段是从全国2585个市县中抽取80个样本市县;第二阶段从样本市县中抽取320个居/村委会;第三阶段从样本居/村委会抽取住户。第一阶段的80个市县来自25个省,诸如西藏、新疆、内蒙古等低收入省份不在25个省之列。80个市县中来自东中西三个地区的个数分别是32、27,21,占比分别为40%、33.75%、26.25%,而全国2585个市县的东中西分分布分别是34.3%、27.2%、38.4%。显然,东部县市样本明显偏多,西部样本比重显著偏低。第二阶段抽样中,“调查”在把80个样本市县按非农人口比重标准五等分组的基础之上,从非农人口比重最低组到最高组,村委会与居委会抽取的个数比率依次为4:0、3:2、2:3、1:3、0:4。村委会和居民会的抽取直接关系到住户样本的城乡比,在下述的第三阶段抽样中,从村委会抽取的住户为农村住户样本,从居委会抽取的住户为城镇样本。这种村/居委会样本的抽取办法最终导致从非农人口比重最低组(16个市县)仅仅抽取农村住户,相反在非农人口最高比重最高组(同样为16个市县)只抽取城镇住户。如此的抽样方法忽视了最低组中的城镇住户和最高组中的农村住户,而这两部分住户的收入大致处于中等程度,对这部分住户抽样不足,以及相应扩大落后地区(非农人口比重较低市县)和发达地区(非农人口比重较高市县)的比重不可避免地高估收入差距。网友长溪岭在其评论中也指出了这一点(长溪岭,2012)。
第三阶段抽样是从村/居委会样本中抽取住户样本。“调查”在住户样本上有意识地多抽取了城镇样本,相应地减少了农村住户样本数。具体地说,每个村委会均抽取20户农户。对于居委会,在把村委会按平均住房价格分成四组后,从属于房价最高一组居委会中(每个居委会)抽取50户,次高组抽取45户,最后的两组依次是40户和35户。如此偏重于城镇住户尤其是高房价住户的住户抽取办法,不可避免地高估家庭财产的持有量,由于财产持有量与收入水平有着密切的关系,同时也高估了高收入人群的权重,从而高估了居民收入差距。
偏重城镇样本和富裕样本的上述抽样办法并不是无意的,而是有意的,是“调查”抽样的目的之所在。“CHFS抽样设计说明”明确表述抽样要满足“经济富裕地区的样本比重性对较大”,“城镇地区的样本比重相对较大”的要求,多抽取城镇样本、以及多抽取富裕户之类的表述多次出现在“CHFS抽样设计说明”,而这种抽样办法被认为是由“研究家庭资产配置、消费储蓄等行为的目的”决定的。研究目的的确立以及据此选择相应的抽样方法都是非常正常的。但是必须意识到的是抽取的样本是否有偏差,是否具有全国代表性,以及从此得到的收入水平及其差距、家庭资产保有量等估计值是否可以推断全国,这一点是至关重要的,对于像基尼系数非常敏感的指标尤其如此。从上述讨论可知,“调查”的抽样以及从此得到收入水平及其差距、家庭资产保有量等估计值完全没有全国代表性,“报告”中0.61的基尼系数不是中国居民收入不平等水平的可信估计值,而诸如“中国居民家庭财产总量超过美国21%”之类的判断也是“根本不靠谱”的(长溪岭,2012)。遗憾的是,“报告”完全没有意识到这一点。
【太多了,放不下,请看原文】
(作者单位:中国人民大学财政金融学院)




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-12-28 16:30:47
我相信只会比这0.61更高而不是低。看看公开报道的需要扶助的人的经济状况就可以知道“景愿很美好,现实很骨感”。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-12-28 16:35:01
砖家叫兽们坐在冬暖夏凉的屋子中但然感受不到现实的残酷。个个泛泛而谈有谁真正的放下身去做点实证性的广泛调查研究。所谓的“公知”已经完全沦陷为不知羞耻的“犬儒"。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-12-28 16:35:37
商女不知亡国恨,隔江犹唱后庭花。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-12-28 16:51:19
九十年代后期中国官方公布的基尼系数连年增长:1996年为0.375,1997年为0.379,1998年为0.386,1999年为0.397,2000年0.412就已经超过了“警戒线”。2000年后为什么就不公布了呢。这不是明摆着的吗?连自己都看着不和谐干脆就贪污了不公布了。但不公布并不表示不存在不在继续恶化和两极分化。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-12-28 16:52:59
从1996的数字到2000年的数字可以看出稍微懂点数理基础的就可以分析回归到大至的比例数据。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群