全部版块 我的主页
论坛 经济学人 二区 外文文献专区
756 23
2022-06-06
英文标题:
《How Much Data Do You Need? An Operational, Pre-Asymptotic Metric for
  Fat-tailedness》
---
作者:
Nassim Nicholas Taleb
---
最新提交年份:
2018
---
英文摘要:
  This note presents an operational measure of fat-tailedness for univariate probability distributions, in $[0,1]$ where 0 is maximally thin-tailed (Gaussian) and 1 is maximally fat-tailed. Among others,1) it helps assess the sample size needed to establish a comparative $n$ needed for statistical significance, 2) allows practical comparisons across classes of fat-tailed distributions, 3) helps understand some inconsistent attributes of the lognormal, pending on the parametrization of its scale parameter. The literature is rich for what concerns asymptotic behavior, but there is a large void for finite values of $n$, those needed for operational purposes. Conventional measures of fat-tailedness, namely 1) the tail index for the power law class, and 2) Kurtosis for finite moment distributions fail to apply to some distributions, and do not allow comparisons across classes and parametrization, that is between power laws outside the Levy-Stable basin, or power laws to distributions in other classes, or power laws for different number of summands. How can one compare a sum of 100 Student T distributed random variables with 3 degrees of freedom to one in a Levy-Stable or a Lognormal class? How can one compare a sum of 100 Student T with 3 degrees of freedom to a single Student T with 2 degrees of freedom? We propose an operational and heuristic measure that allow us to compare $n$-summed independent variables under all distributions with finite first moment. The method is based on the rate of convergence of the Law of Large numbers for finite sums, $n$-summands specifically. We get either explicit expressions or simulation results and bounds for the lognormal, exponential, Pareto, and the Student T distributions in their various calibrations --in addition to the general Pearson classes.
---
中文摘要:
本注释给出了一个单变量概率分布的胖尾性的操作度量,单位为$[0,1]$,其中0为最大细尾(高斯),1为最大胖尾。除其他外,1)它有助于评估建立统计显著性所需的比较样本量,2)允许在不同类别的厚尾分布之间进行实际比较,3)有助于理解对数正态分布的一些不一致属性,取决于其尺度参数的参数化。有关渐近行为的文献非常丰富,但对于$n$的有限值,即用于操作目的的有限值,存在很大的空白。传统的厚尾性度量,即1)幂律类的尾部指数,以及2)有限矩分布的峰度,无法适用于某些分布,并且不允许跨类和参数化进行比较,即在列维稳定流域以外的幂律之间,或在其他类的分布之间,或在不同总和数的幂律之间。如何将100个三自由度学生T分布随机变量的总和与Levy稳定或对数正态类中的一个进行比较?一个人如何将一个有3个自由度的100个学生T的总和与一个有2个自由度的学生T的总和进行比较?我们提出了一个操作性和启发性的度量方法,允许我们在有限第一矩的所有分布下比较n$和的自变量。该方法基于有限和的大数定律的收敛速度,特别是n$-和。我们得到了对数正态分布、指数分布、帕累托分布和学生T分布在各种校准中的显式表达式或模拟结果和界,以及一般的Pearson类。
---
分类信息:

一级分类:Statistics        统计学
二级分类:Methodology        方法论
分类描述:Design, Surveys, Model Selection, Multiple Testing, Multivariate Methods, Signal and Image Processing, Time Series, Smoothing, Spatial Statistics, Survival Analysis, Nonparametric and Semiparametric Methods
设计,调查,模型选择,多重检验,多元方法,信号和图像处理,时间序列,平滑,空间统计,生存分析,非参数和半参数方法
--
一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-6-6 21:33:49
胖尾统计项目您需要多少数据?厚尾Nessnassim Nicholas TalebTandon工程学院的前渐近度量,纽约大学2018年11月即将出版的《国际预测杂志》(International Journal of ForecastingStract)本文提出了一个具有有限第一矩的单变量无模概率分布的操作度量,其中0为最大细尾(高斯),1为最大厚尾。它基于“一个人需要多少数据才能对给定数据库做出有意义的陈述?”应用:除其他外,它o有助于评估高斯分布以外的统计信号所需的样本量n,o有助于测量收敛到高斯分布(或稳定盆地)的速度,o允许对不同类别的胖尾分布进行实际比较,o允许评估投资组合构建中所需的证券数量,以实现一定程度的分散风险降低,o帮助评估各种设置下的风险,o帮助理解对数正态分布的一些不一致属性,取决于其方差的参数化。有关渐近行为的文献非常丰富,但对于n的有限值,即操作目的所需的值,存在很大的空白。背景:传统的厚尾性度量方法,即1)幂律类的尾部指数,以及2)有限矩分布的峰度,无法适用于某些分布,并且不允许跨类和参数化进行比较,即在列维稳定流域以外的幂律之间,或幂律与其他类的分布之间,或不同求和数的幂律。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-6 21:33:52
一个人如何将100个具有3个自由度的学生分布随机变量的总和与Levy稳定或对数正态类中的一个进行比较?佳能如何将一个有3个自由度的100个学生T的总和与一个有2个自由度的学生T的总和进行比较?我们提出了一个操作性和启发性指标,允许我们在第一时刻确定的所有分布中比较n个求和的独立变量。该方法作者最应归功于Michail Loulakis的重点评论,此外,他还为Student T和对数正态分布的κ极限提供了严格的推导,以及Spyros Makridakis的耐心和智慧。该论文最初于2016年9月12日至16日在莱顿洛伦茨中心和2017年10月在库兰特研究所吉姆·盖瑟尔的Festschrift发表,主题为《高维度的极端与风险》。作者感谢Jean-PhilippeBouchaud、John Einmall、Pasquale Cirillo和其他人。劳伦斯·德哈恩建议将指标名称从“gamma”改为“kappa”,以避免混淆。此外,感谢科尔曼·汉弗莱、迈克尔·劳勒、丹尼尔·杜弗雷恩和其他人对推导的讨论和见解。基于有限和的largenumbers定律的收敛速度,特别是n-和。我们得到了对数正态分布、指数分布、帕累托分布和学生T分布在各种校准中的显式表达式或模拟结果和界,以及一般Pearson类。Cauchy(κ=1)Pareto 1.14立方Student TGaussian(κ=0)Degrees of at Tailedness2 4 6 10 N246810|Sn=X1+X2++Xn |图1。κ测量的直观性:r.v.Sn的相同拷贝之和的平均偏差=X+X+。xn随着样本的增加,我们将讨论如何比较不同类别的前共感分布。我
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-6 21:33:55
导言和定义表明,我们可以将尾部α=2.1的帕累托分布与高斯分布进行比较吗?即,在方差有限的情况下,可以将其与高斯分布进行比较吗?渐进地,这些具有单位秒矩的规则变化类的分布在求和下变为高斯分布,但在预交感作用下,我们没有标准的方法来比较它们,因为依赖于更高矩的度量,如峰度,无法提供帮助。我们也无法将有限方差帕累托分布与其极限α稳定分布(当两者具有相同的尾部指数或尾部指数)进行比较。同样,我们如何将一个具有3个自由度的学生T的“厚尾”与一个尾部指数为1.95的LevyStable的“厚尾”进行比较?两种分布都有一个确定的平均值;在这两个变量中,只有第一个变量具有有限的方差,但根据一些操作标准,对于少数总和,其表现更为“厚尾”。“厚尾”指的是金融从业人员使用的通用术语,指的是比高斯分布更厚的尾,而不是指任何特定类别的分布。胖尾统计项目2κ1,30κ1100κ11000中心界限(κ1)1.0 1.5 2.0 2.5 3.0 3.5 4.0α0.00.20.40.60.81.0κ帕累托(α)κ1,30κ1100κ11.5 2.0 2.5 3.0 3.5 4.0α0.20.40.60.81.0κ学生T(α)图2。观察广义中心极限定理的效果:帕累托分布和学生T分布,在P类中,α指数,κ收敛到2- (α<2α +α≥22),或稳定的S级。我们观察到收敛速度有多慢,即使在1000个求和之后。这削弱了Mandelbrot的观点,即有限方差帕累托可以包含在稳定分布中。1) “厚尾性”标准:根据每个定义,有多种方法“定义”厚尾和等级分布。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-6 21:33:57
在所有矩有限的窄类分布中,是峰度,它允许简单比较并测量偏离高斯分布的情况,高斯分布用作范数。对于幂律类,它可以是尾部指数。也可以使用极值,取超过最大值的概率,通过量表进行调整(如极值理论中所实践的)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-6 21:34:02
对于操作用途,从业者的厚尾性是一种集中度,例如“有多少统计特性可归因于单个观察?”,或者,通过尺度(或平均离散度)适当调整,“一个国家的总财富掌握在最富有的个人手中有多少?”在这里,我们使用以下标准来衡量我们的目的,这与上一段中的浓度测量相吻合:“额外数据(在这种概率分布下)将在多大程度上有助于提高观察平均值的稳定性”。其目的并不完全是统计上的:它同样意味着:“在我的投资组合配置中增加额外的证券(即保持总不变)会在多大程度上增加其稳定性?”我们的度量与渐近度量(尤其是极值理论中使用的度量)的不同之处在于,它基本上是预交感的。现实生活和现实世界的实现都在渐近线之外。2) 指标做了什么:我们提出的指标,κ做了以下工作:o允许比较n-对给定数量的求和变量进行不同分布的求和,或对不同n进行相同分布的求和,并评估给定分布的预交感性质提供与极限分布(即Lévyα-稳定盆地)的距离度量(高斯分布是其特例)对于统计推断,允许评估大数定律的“速度”,表示为由于样本量n的增加,平均绝对误差的变化。允许比较评估两种不同单变量分布的“厚尾性”,当两种分布都具有有限的第一时刻允许我们提前知道蒙特卡罗模拟需要多少次运行。3) 统计推断的状态:最后一点“速度”似乎被忽略了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群