附:基尼系数和洛伦兹曲线
基尼系数是常用的测度不平等的一个统计量,使用基尼平均差的基尼系数定义是
𝐺=∑𝑖=1𝑛∑𝑗=1𝑛|𝑦𝑗−𝑦𝑖|/2𝑛2𝜇
其中 𝑦𝑗 和 𝑦𝑖 是来自同一总体的不同样本, 𝑛 是样本量, 𝜇 是样本均值, 𝜇=∑𝑛𝑖=1𝑦𝑖/𝑛 。基尼系数又可改写成收入 𝑦𝑖 与其排序后序数的斜方差的形式,可以令计算更简便。将样本值从低到高排序,排序后的样本为 𝐲=[𝑦1,𝑦2,...,𝑦𝑛]′ ,其中 𝑦1≤𝑦2≤...≤𝑦𝑛 ,基尼系数就改写为
𝐺=1𝑛2𝜇∑𝑖=1𝑛(2𝑖−𝑛−1)𝑦𝑖
基尼系数与洛伦兹曲线具有一致性,将样本收入从低到高排序后,横轴为样本累积密度占总体的比例,纵轴为样本累积收入占总收入的比例,洛伦兹曲线就是收入最低的前x%的人他们的收入占总收入的比例y%。洛伦兹曲线与45度平等线所夹的面积占下方三角形的面积的比例就等于基尼系数。