全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
973 2
2022-05-24
编写一个rclass的ado程序,用以计算样本的基尼系数,并绘制洛伦兹曲线。求求大佬救救孩子的作业了,感激不尽!
  • 程序名ginicalc,功能:计算基尼系数并绘制洛伦兹曲线图。要求语法:

    Syntax:
    ginicalc varlist [if] [in] [, lorenz byvar(varname)]
    返回结果:
    r(gini)
    r(N)

  • 要求支持if,in表达式。默认不绘制洛伦兹曲线,若有lorenz option的话,则绘制洛伦兹曲线。
  • 要求程序支持byvar(varname) option,作用是依varname变量分别计算基尼系数并绘制洛伦兹曲线。varname是比如性别等categorical变量。
  • rclass程序。要求打印输出结果,并作为rclass以matrix gini和matrix N返回。其中matrix的column names是变量名列表,row names是varname=levelsof varname,若无byvar,则不设置rownames。矩阵的使用可help matrix。
    例如,ginicalc var1 var2, byvar(gender),且gender={0,1},那么gini矩阵应是
  • 将多个变量或多个byvar的洛伦兹曲线绘制到一张图上。但当同时有两个及两个以上变量,又有byvar(varname)时,不绘制洛伦兹曲线图。
  • 本课上未讲如何用Stata作图,因此绘制洛伦兹曲线非本次作业强制要求,只要基尼系数的计算正确就可以得到满分。若完成绘制洛伦兹曲线则可额外加分。

提示:可用line y x [, sort]来绘制曲线图,sort的作用是绘制时样本点按 x 排序。别忘了绘制洛伦兹曲线时同时绘制45°线。具体可help graph / help line。









二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-5-24 17:26:02
附:基尼系数和洛伦兹曲线

基尼系数是常用的测度不平等的一个统计量,使用基尼平均差的基尼系数定义是
𝐺=∑𝑖=1𝑛∑𝑗=1𝑛|𝑦𝑗−𝑦𝑖|/2𝑛2𝜇

其中 𝑦𝑗 和 𝑦𝑖 是来自同一总体的不同样本, 𝑛 是样本量, 𝜇 是样本均值, 𝜇=∑𝑛𝑖=1𝑦𝑖/𝑛 。基尼系数又可改写成收入 𝑦𝑖 与其排序后序数的斜方差的形式,可以令计算更简便。将样本值从低到高排序,排序后的样本为 𝐲=[𝑦1,𝑦2,...,𝑦𝑛]′ ,其中 𝑦1≤𝑦2≤...≤𝑦𝑛 ,基尼系数就改写为
𝐺=1𝑛2𝜇∑𝑖=1𝑛(2𝑖−𝑛−1)𝑦𝑖

基尼系数与洛伦兹曲线具有一致性,将样本收入从低到高排序后,横轴为样本累积密度占总体的比例,纵轴为样本累积收入占总收入的比例,洛伦兹曲线就是收入最低的前x%的人他们的收入占总收入的比例y%。洛伦兹曲线与45度平等线所夹的面积占下方三角形的面积的比例就等于基尼系数。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-28 16:30:09
私聊         
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群