全部版块 我的主页
论坛 经济学人 二区 外文文献专区
1115 27
2022-06-01
英文标题:
《Gini estimation under infinite variance》
---
作者:
Andrea Fontanari, Nassim Nicholas Taleb, Pasquale Cirillo
---
最新提交年份:
2017
---
英文摘要:
  We study the problems related to the estimation of the Gini index in presence of a fat-tailed data generating process, i.e. one in the stable distribution class with finite mean but infinite variance (i.e. with tail index $\\alpha\\in(1,2)$). We show that, in such a case, the Gini coefficient cannot be reliably estimated using conventional nonparametric methods, because of a downward bias that emerges under fat tails. This has important implications for the ongoing discussion about economic inequality.   We start by discussing how the nonparametric estimator of the Gini index undergoes a phase transition in the symmetry structure of its asymptotic distribution, as the data distribution shifts from the domain of attraction of a light-tailed distribution to that of a fat-tailed one, especially in the case of infinite variance. We also show how the nonparametric Gini bias increases with lower values of $\\alpha$. We then prove that maximum likelihood estimation outperforms nonparametric methods, requiring a much smaller sample size to reach efficiency.   Finally, for fat-tailed data, we provide a simple correction mechanism to the small sample bias of the nonparametric estimator based on the distance between the mode and the mean of its asymptotic distribution.
---
中文摘要:
我们研究了存在厚尾数据生成过程的基尼指数估计相关问题,即具有有限平均值但无限方差的稳定分布类中的数据生成过程(即具有尾指数$\\α\\ in(1,2)$)。我们表明,在这种情况下,基尼系数无法使用传统的非参数方法可靠估计,因为在厚尾下会出现向下的偏差。这对正在进行的关于经济不平等的讨论具有重要影响。我们首先讨论基尼指数的非参数估计如何在其渐近分布的对称结构中经历相变,因为数据分布从轻尾分布的吸引域转移到厚尾分布的吸引域,特别是在无穷方差的情况下。我们还展示了非参数基尼偏差如何随着$\\α$值的降低而增加。然后,我们证明了最大似然估计优于非参数方法,需要更小的样本量才能达到效率。最后,对于厚尾数据,我们基于模式与其渐近分布均值之间的距离,为非参数估计的小样本偏差提供了一种简单的校正机制。
---
分类信息:

一级分类:Statistics        统计学
二级分类:Methodology        方法论
分类描述:Design, Surveys, Model Selection, Multiple Testing, Multivariate Methods, Signal and Image Processing, Time Series, Smoothing, Spatial Statistics, Survival Analysis, Nonparametric and Semiparametric Methods
设计,调查,模型选择,多重检验,多元方法,信号和图像处理,时间序列,平滑,空间统计,生存分析,非参数和半参数方法
--
一级分类:Quantitative Finance        数量金融学
二级分类:Risk Management        风险管理
分类描述:Measurement and management of financial risks in trading, banking, insurance, corporate and other applications
衡量和管理贸易、银行、保险、企业和其他应用中的金融风险
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-6-1 02:29:55
有限方差下的基尼估计Andrea Fontanari-代尔夫特理工大学和Cwinasim Nicholas Taleb-Tandon工程学院,NYUPasquale Cirillo1,2-代尔夫特理工大学摘要我们研究了在数据生成过程中与基尼指数估计相关的问题,即,稳定分布类中的一个,具有有限的平均值,但具有有限的方差(即尾部指数α∈ (1, 2)). 我们表明,在这种情况下,基尼系数无法使用传统的非参数方法可靠估计,因为在厚尾下会出现向下的偏差。这对正在进行的关于经济不平等的讨论具有重要影响。我们首先讨论基尼指数的非参数估计如何在其渐近分布的对称结构中经历相变,因为数据分布从轻尾分布的吸引域转移到厚尾分布的吸引域,特别是在有限方差的情况下。我们还展示了非参数基尼偏差如何随着α值的降低而增加。然后,我们证明了最大似然估计优于非参数方法,需要小得多的样本才能达到效率。最后,对于厚尾数据,我们基于模式与其渐近分布均值之间的距离,为非参数估计的小样本偏差提供了一种简单的校正机制。关键词:基尼指数;不平等测度;尺寸分布;极端情况;α-稳定分布。1、导言财富不平等研究是经济学、统计学和经济物理学的一个领域,涉及厚尾数据生成过程,通常具有有限的方差[2,19]。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 02:29:58
如果我们还记得,首次提出了肥胖分布的原型帕累托模型来模拟家庭收入,这一点也不奇怪[22]。然而,在财富研究的背景下,数据的厚尾性可能存在问题,作为效率的财产(部分地,这些作者很高兴地承认欧盟H2020玛丽·斯克洛多斯卡居里(Marie Sklodowskakarie)赠款协议(第643045号)的慷慨支持。帕斯夸尔·西里洛(Pasquale Cirillo)也承认欧盟玛丽·斯克洛多斯卡居里(Marie Sklodowskakarie)职业整合赠款多元冲击(PCIG13-GA2013-618794)的支持。通讯作者:P。Cirillo@tudelft.nl.地址:荷兰代尔夫特技术大学EEMCSFaculty应用概率小组,Mekelweg 4,2628CD代尔夫特。电话:+31.15.27.82.589。提交给Elsevier的预印本(2017年12月19日一致性)不一定适用于许多不等式和集中度的估计值[13,19]。这项工作的范围是展示厚尾如何影响对经济不平等最著名的衡量指标之一基尼指数(Gini index)[9,17,30]的估计,基尼指数是经济物理学和经济学文献中经常使用(和滥用)的,是描述全世界财富分布和集中的主要工具[2,3,23]。关于基尼指数估计的文献是广泛而全面的(例如[9,30]进行综述),然而,奇怪的是,几乎没有人注意到它在存在胖尾的情况下的行为,如果我们考虑到以下情况,这很奇怪:1)胖尾在收入和财富的经验分配中无处不在[19,23],2)基尼指数本身可以被视为可变性和厚尾性的衡量标准[8、10、11、15]。基尼指数估计的标准方法是非参数方法:使用下面的方程式(5)根据可用数据的经验分布计算该指数。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 02:30:02
但是,正如我们在本文中所显示的,当我们处理厚尾观测时,该估计量存在向下偏差。因此,我们的目标是通过推导存在厚尾的非参数基尼估计量的极限分布来缩小这一差距,并提出可能的策略来减少偏差。我们展示了与非参数方法相比,尽管存在模型误判的风险,最大似然方法如何需要更少的观察来获得效率。我们的结果与托马斯·皮克蒂(Thomas Piketty)最近在[23,24]中提出的关于财富不平等的讨论有关,因为对厚尾和有限方差下基尼指数的估计可能会导致一些经济分析不可靠,如果不是明显错误的话。为什么要相信有偏见的估计员?通过厚尾数据,我们表示由正随机变量X生成的数据,其累积分布函数(c.d.f.)f(X),其α阶数通常变化【16】,也就是说,f(X):=1- F(x),一个haslimx→∞xα′F(x)=L(x),(1),其中L(x)是一个缓慢变化的函数,使得limx→∞L(cx)L(x)=1,其中c>0,其中α>0称为尾部指数。规则变化分布定义了一大类随机变量,在处理极大值和极小值的概率行为时,极值理论[7,13]对其特性进行了广泛研究。正如【4】所指出的,规则变化和厚尾确实是同义词。众所周知,如果X。。。,方程(1)中定义了c.d.f.f(x)在规则变化类别中的i.i.d.观测值,则其数据生成过程属于弗里谢分布的最大吸引域。类似的偏差也会影响分位数贡献的非参数测量,即“前1%拥有总财富的x%”类型的分位数[27]。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 02:30:04
本文将该问题扩展到更广泛的基尼系数,并通过与极限定理联系进一步深入。参数ρ的符号X∈ MDA(Φ(ρ))[7]。这意味着,对于部分最大值Mn=max(X,…,Xn),一个搭扣一-1n(Mn-bn)≤ x个d→ Φ(ρ)=e-x个-ρ、 ρ>0,(2)an>0且bn∈ R两个标准化常数。显然,规则变化系数α和弗里谢分布参数ρ之间的关系由以下公式得出:α=ρ[13]。Fréchet分布是极值理论中最大值的极限分布之一,与Gumbel分布和Weibull分布一样;它代表了无尾和无界极限情况[7]。因此,经常变化的随机变量与弗里切特类别之间的关系允许我们处理非常大的随机变量家族(和经验数据),并允许我们展示基尼指数如何受到最大值(即极端财富)的高度影响,正如直觉所明确指出的那样【15,19】,尤其是在有限方差下。同样,这建议在讨论厚尾巴下的经济不平等时要小心谨慎。值得记住的是,afat尾随机变量X的矩的存在(不确定性)取决于尾指数α,实际上(Xδ)<∞ 如果δ≤ α、 E(Xδ)=∞ 如果δ>α。(3) 在这项工作中,我们将重点限制在具有有限元和有限方差的数据生成过程上,因此,根据方程式(3),我们将重点放在具有尾部指数α的规则变化分布上∈ (1, 2).表1和图1以数字和图形的方式展示了我们的故事,并根据从帕累托分布(下面的方程式(13))中抽样的人工观察得出结论,尾部参数α等于1.1。表1比较了方程(5)中的非参数基尼指数与第3节中基于最大似然(ML)尾的指数。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 02:30:08
对于表1中的不同样本量,我们生成了10个样本,通过蒙特卡罗平均估计量。如第一列所示,非参数估计值与真实基尼值(g=0.8333)的收敛速度非常慢,且单调递增;这表明,不仅非参数估计量分布的尾部结构存在问题,而且其对称性也存在问题。图1提供了一些数字证据,表明当数据以有限方差为特征时,非参数基尼指数的极限分布失去了正态性和对称性[14],向倾斜和厚尾极限转移。正如我们在第2节中所证明的那样,当数据生成过程处于厚尾分布的吸引域中时,基尼指数的渐近分布变成了向右倾斜的α-稳定定律。这种行为变化是胖尾下非参数基尼向下偏移的原因。然而,对新极限的了解使我们能够对非参数估计量提出修正,提高其质量,图1:两个具有不同尾部指数、有限和有限方差的帕累托(I型)分布的基尼非参数估计量柱状图(图已居中以便于比较)。样本量:10。样本数量:每个分布10个。从而降低了错误估计财富不平等的风险,以及在经济和社会政策方面可能产生的所有后果【19、23、24】。表1:使用尾α=1.1(有限平均值,有限方差)的帕累托数据和不同样本,比较非参数(NonPar)和最大似然(ML)基尼估计值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群