例:以表2所示数据为例,计算甲国与乙国的基尼系数。
人口百比分
| 0-20
| 20-40
| 40-60
| 60-80
| 80-100
|
每组人口百分比
| 0.2
| 0.2
| 0.2
| 0.2
| 0.2
|
甲国每组财富所占百分比
| 3
| 8
| 10
| 15
| 64
|
甲国向上累计财富百分比
| 3
| 11
| 21
| 36
| 100
|
乙国每组财富所占百分比
| 8
| 12
| 15
| 20
| 48
|
乙国向上累计财富百分比
| 5
| 17
| 32
| 52
| 100
|
甲国的基尼系数g1=1-0.2[2×0.71+1]=1-0.2×2.42=0.516
乙国的基尼系数g2=1-0.2[2×1.06+1]=1-0.2×3.12=0.376
这验证了前面得出的结论——甲国的基尼系数比乙国的基尼系数大。
五、基尼系数与标准差计算的比较
基尼系数的计算不同于标准差的计算。标准差的计算通常需要全部的数据信息,而基尼系数的计算则只需要少量分组比重信息就可以估算。比如即使知道一个财富分配的比例数据,也可以估算基尼系数。因为,只要知道洛伦茨曲线上不同于两个端点O点与E点的任意一个点,那么就可以把这个点与原点O与右上角的项点E点连成一个折线,从而这个折线就是已知这一个数据而形成的洛伦茨曲线。如果知道更多的数据,那么这个折线可以画得更详细,但是容易证明,那就是,假设已知数据之间不包含矛盾,那么当一个分组数据集M是另一个分组数据集N的子集时,那么穿过数据集N的洛伦茨曲线也穿过数据集M的洛伦茨曲线,穿过数据集M的洛伦茨曲线构成穿过数据集N的洛伦茨曲线的一个子集。并且穿过数据集N的洛伦茨曲线位于穿过数据集M的洛伦茨曲线的下方。从而所知数据越少,所画的洛伦茨曲线的近似折线与绝对平均线即45度线之间的面积越小,从而所知数据越少,估算的基尼系数与真实的基尼系数相比,将会变得更小。从而,从理论上讲,知道一个数据所估计的基尼系数将大大小于真实的基尼系数。
六、中国的基尼系数至少达到0.696
下面以中国的财富分配数据为例来说明这一点。
据世界发展银行引用中国社会科学院研究结果显示,在2009年“0.4%的中国人占有70%的财富”。以此为关键词在网络上搜索可以得到大量这方面的报道。
由此可知,低收入群体的99.6%的人口只占有中国财富总量的30%。为了方便起见,下面以1000作为坐标正方形的边长。画出洛伦茨曲线曲线如下:
在上图中,已知“0.4%的中国人占有70%的财富”,则洛伦茨曲线为OAE折线。其中A点坐标为(996,300),E点坐标为(1000,1000)。为计算基尼系数,先计算三角形OCA、三角形ABE与矩形ACKB的面积。
三角形OCA的面积=996×300/2=149400
三角形ABE的面积=700×4/2=1400
矩形ACKB的面积=300×4=1200
从而洛伦茨曲线下方的面积=149400+1400+1200=152000
而三角形OKE的面积=1000×1000/2=500000
从而洛伦茨曲线与绝对平均线之间围成的面积=500000-152000=348000
从而基尼系数g=348000/500000=0.696
因此,可以知道,中国在2009年的实际基尼系数应该大于0.696。上面已经说过,只通过一个数据所估算的基尼系数要小于实际的基尼系数。
二〇一〇年十月二十六日10时29分21秒