全部版块 我的主页
论坛 经济学人 二区 外文文献专区
1188 16
2022-05-06
英文标题:
《On the Super-Additivity and Estimation Biases of Quantile Contributions》
---
作者:
Nassim N Taleb, Raphael Douady
---
最新提交年份:
2014
---
英文摘要:
  Sample measures of top centile contributions to the total (concentration) are downward biased, unstable estimators, extremely sensitive to sample size and concave in accounting for large deviations. It makes them particularly unfit in domains with power law tails, especially for low values of the exponent. These estimators can vary over time and increase with the population size, as shown in this article, thus providing the illusion of structural changes in concentration. They are also inconsistent under aggregation and mixing distributions, as the weighted average of concentration measures for A and B will tend to be lower than that from A U B. In addition, it can be shown that under such fat tails, increases in the total sum need to be accompanied by increased sample size of the concentration measurement. We examine the estimation superadditivity and bias under homogeneous and mixed distributions.
---
中文摘要:
对总(浓度)的上百分位贡献的样本度量是向下倾斜的、不稳定的估计量,对样本量极为敏感,在解释大偏差时呈凹形。这使得它们特别不适用于具有幂律尾的领域,尤其是指数值较低的领域。如本文所示,这些估计器可以随着时间的推移而变化,并随着人口规模的增加而增加,从而提供了集中度结构变化的假象。在聚集分布和混合分布下,它们也不一致,因为A和B浓度测量的加权平均值往往低于A和B的加权平均值。此外,可以证明,在这种厚尾情况下,总总和的增加需要伴随浓度测量样本量的增加。我们研究了齐次分布和混合分布下的估计超加性和偏差。
---
分类信息:

一级分类:Statistics        统计学
二级分类:Applications        应用程序
分类描述:Biology, Education, Epidemiology, Engineering, Environmental Sciences, Medical, Physical Sciences, Quality Control, Social Sciences
生物学,教育学,流行病学,工程学,环境科学,医学,物理科学,质量控制,社会科学
--
一级分类:Quantitative Finance        数量金融学
二级分类:Risk Management        风险管理
分类描述:Measurement and management of financial risks in trading, banking, insurance, corporate and other applications
衡量和管理贸易、银行、保险、企业和其他应用中的金融风险
--
一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-5-6 05:02:46
极端风险倡议——纽约大学工程学院关于分位数贡献的超可加性和估计偏差的工作论文系列Nassim Nicholas Taleb*, 拉斐尔·杜阿迪+*纽约大学工程学院+Riskdata&C.N.R.S.Paris,Labex ReFi,索邦经济中心Abstract对总(浓度)的百分位数贡献的样本测量是向下倾斜的、不稳定的估计量,对样本量极为敏感,在解释大偏差时呈凹形。这使得它们在具有幂律尾的领域尤其不适用,尤其是在指数值较低的情况下。如本文所示,这些估计器可以随着时间的推移而变化,并随着人口规模的增加而增加,从而提供了集中度结构变化的结论。在聚集分布和混合分布下,它们也是一致的,因为A和B浓度测量的加权平均值往往低于A∪ B.此外,可以看出,在这种厚尾情况下,总总量的增加需要伴随着浓度测量样本量的增加。我们研究了齐次分布和混合分布下的估计超加性和偏差。第四版,2014年11月11日。简介维尔弗雷多·帕雷托注意到,意大利80%的土地属于20%的人口,反之亦然,这就催生了幂律分布和俗语80/20。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 05:02:50
幂律[1]和[2]属性的核心自相似性允许我们递归并将80/20应用于剩余的20%,以此类推,直到我们得到这样一个结果,即人口中最顶层的人约占总财富的53%。看起来,这种浓度测量可能存在严重偏差,这取决于它的测量方式,因此,帕累托观察到的浓度的真实比率,即最高百分位的比例,很可能接近70%,因此同比变化将从更大的样本漂移到更高的水平。事实上,正如我们将在本次讨论中所展示的那样,比如说财富,由于技术进步而产生的更为复杂的样本,以及更大的人口和经济增长,将通过随时间增加而使这种衡量趋同,原因除了样本空间或总价值的扩大。问题的核心是,对于一类有尾随机变量,即左有界右无界,其中随机变量X∈[xmin,∞), 样本内分位数贡献是实际分位数贡献真实值的偏差估计。让我们定义分位数贡献κq=qE[X | X>h(q)]E[X],其中h(q)=inf{h∈ [xmin+∞) , P(X>h)≤ q} 是给定样本(Xk)1的概率q的超出阈值≤K≤n、 它的“自然”估计量bκq≡大多数学术研究中使用的qthpercentiletotal可以表达为asbκq≡Pni=1Xi>^h(q)XiPni=1Xi,其中^h(q)是概率q:^h(q)=inf{h:nnXi=1x>h的估计超越阈值≤ q} 我们将看到,观察到的变量bκQI是真实比率κq的一个向下偏差估计量,该估计量将维持样本,这种偏差与样本的肥度成比例,并且对于非常厚尾分布,即使对于非常大的样本,仍然是显著的。二、
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 05:02:53
非混合帕累托分布的估计设X是一个随机变量,属于具有“幂律”右尾的分布类,即:P(X>X)~ L(x)x-α(1)式中L:[xmin+∞) → (0, +∞) 是一个缓慢变化的函数,定义为limx→+∞L(kx)L(x)=1表示任何k>0。对于小超标分位数(<50%),各种可能分布之间几乎没有差异,如学生t、Lévyα-稳定分布、达贡分布[3]、[4]辛格-马达拉分布[5]或直帕累托分布。指数1≤ α ≤ 2.正如[6]中所观察到的,大数定律的运行速度非常慢。这个问题对于α是尖锐的,但严格高于1,并且随着它的偏离,对于α=1,这个问题是严重的。A.偏差和收敛1)简单的帕累托分布:让我们首先考虑φα(x)α-帕累托分布的密度,从下方以xmin>0为界,换句话说:φα(x)=αxαminx-α-1x≥xmin和p(X>X)=xminxα. 在这些假设下,超越临界点为h(q)=xminq-1/α,我们有:κq=R∞h(q)xφ(x)dxR∞xminxφ(x)dx=h(q)xmin1.-α=qα-1α(2)极端风险倡议——纽约大学工程学院工作论文系列2如果X的分布是α-帕累托分布,仅超过一个临界点xCut,我们假设它低于h(q),因此我们有p(X>X)=λxα对于某些λ>0,我们仍然有h(q)=λq-1/α和κq=α- 1λE[X]qα-因此,对于a的实际分布,a的指数α与λ的比值λ等于λ,或α与λ的比值λ的估计值λ在表中表示,包括已开发的。在这种情况下,估计量对“小”样本非常敏感,“小”意味着在实践中10。我们在不同的样本规模上进行了多达一万亿次的模拟。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 05:02:56
而κ0.01≈ 0.657933,即使样本规模为1亿,仍然存在严重偏差,如表中所示。自然地,对于远离1的α,偏差迅速(非线性)减小,对于常数α,偏差在2的邻域内变弱,但对于α,偏差不是在混合分布下,我们将在后面讨论。在前1%的百分位数之外,它也较弱,因此本次讨论的重点是著名的“百分之一”和α指数的低值。表一:从10Monte Carlo实现中得出的κ=0.657933的估计偏差bκ(n)平均标准偏差MC runsbκ(10)0.405235 0.367698 0.160244bκ(10)0.485916 0.458449 0.117917bκ(10)0.539028 0.516415 0.0931362bκ(10)0.581384 0.555997 0.0853593bκ(10)0.591506 0.575262 0.0601528bκ(10)0.5130.397鉴于这些结果,我们进行了大量测试,我们可以推测偏倚κq-bκq(n)是c(α,q)n级的-b(q)(α)-1) 式中,康斯坦茨b(q)和c(α,q)需要计算。模拟表明,无论α和q的值是多少,B(q)=1,但估值器及其标准偏差的收敛速度相当慢,因此难以精确估计。2) 一般情况:在一般情况下,让我们确定阈值h,并定义:κh=P(x>h)E[x | x>h]E[x]=E[XX>h]E[x],这样我们就有了κq=κh(q)。我们还定义了n样本估计器:bκh≡Pni=1Xi>hXiPni=1Xi,其中有n个独立的X拷贝。κqby bκqlies的估计偏差背后的直觉是不同的。该值低于文献中可以找到的估计指数(约2),如下[7],是一个较低的估计值,不能从观察中排除。关于创新(新样本值)的集中度度量的凹度,是否低于阈值以上。设Ah(n)=Pni=1Xi>hxinds(n)=Pni=1Xi,这样bκh(n)=Ah(n)S(n)并假设为h。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 05:02:59
如果一个新的样本值Xn+1<h,那么新的值是bκh(n+1)=Ah(n)S(n)+Xn+1。该值为converxin Xn+1,因此Xn+1上的不确定性会增加其预期值。在方差条件下,如果新样本值Xn+1>h,则新值bκh(n+1)≈啊(n)+Xn+1-hS(n)+Xn+1-h=1-S(n)-Ah(n)S(n)+Xn+1-h、 它现在在Xn+1中是凹的,所以Xn+1上的不确定性会降低它的值。这两个相反的效应之间的竞争是后者的狂热,因为变量具有更高的凹度,并且变量在高于阈值的条件下比低于阈值的条件下具有更高的可变性(无论其测量结果如何)。分布的右尾越胖,影响就越大。总体而言,我们发现E[bκh(n)]≤E[Ah(n)]E[S(n)]=κh(请注意,解冻阈值^h(q)也会降低浓度测量估计值,增加引入一个额外样本时的效果,因为估计值^h(q)的预期值略有增加,尽管这种效果相当可忽略)。事实上,我们有以下几点:主张1。设X=(X)ni=1a随机样本,其中sizen>q,Y=Xn+1是一个额外的单次随机观察,并确定:bκh(X t Y)=Pni=1Xi>hXi+Y>hYPni=1Xi+Y。我们注意到,每当Y>h,就有:bκh(X t Y)Y≤ 对于bκqas,这个不等式仍然有效。^h(q,X,t)的值不依赖于Y>^h(q,X)的特定值。我们面临着一种不同于常见的小样本效应的情况,这种效应是由尾巴上罕见的观测结果产生的高影响造成的,而尾巴不太可能出现在小样本中,这种偏差通过重复样本运行而消失。估计器的共通性构成了有限时间内测量的上界,从而消除了较大的偏差,这导致了聚合问题,我们将在定理1中陈述。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群