您需要多少数据？一个可操作的前渐近度量

933

收藏 2022-06-06

英文标题：
《How Much Data Do You Need? An Operational, Pre-Asymptotic Metric for
Fat-tailedness》
---
作者：
Nassim Nicholas Taleb
---
最新提交年份：
2018
---
英文摘要：
This note presents an operational measure of fat-tailedness for univariate probability distributions, in $[0,1]$ where 0 is maximally thin-tailed (Gaussian) and 1 is maximally fat-tailed. Among others,1) it helps assess the sample size needed to establish a comparative $n$ needed for statistical significance, 2) allows practical comparisons across classes of fat-tailed distributions, 3) helps understand some inconsistent attributes of the lognormal, pending on the parametrization of its scale parameter. The literature is rich for what concerns asymptotic behavior, but there is a large void for finite values of $n$, those needed for operational purposes. Conventional measures of fat-tailedness, namely 1) the tail index for the power law class, and 2) Kurtosis for finite moment distributions fail to apply to some distributions, and do not allow comparisons across classes and parametrization, that is between power laws outside the Levy-Stable basin, or power laws to distributions in other classes, or power laws for different number of summands. How can one compare a sum of 100 Student T distributed random variables with 3 degrees of freedom to one in a Levy-Stable or a Lognormal class? How can one compare a sum of 100 Student T with 3 degrees of freedom to a single Student T with 2 degrees of freedom? We propose an operational and heuristic measure that allow us to compare $n$-summed independent variables under all distributions with finite first moment. The method is based on the rate of convergence of the Law of Large numbers for finite sums, $n$-summands specifically. We get either explicit expressions or simulation results and bounds for the lognormal, exponential, Pareto, and the Student T distributions in their various calibrations --in addition to the general Pearson classes.
---
中文摘要：
本注释给出了一个单变量概率分布的胖尾性的操作度量，单位为$[0,1]$，其中0为最大细尾（高斯），1为最大胖尾。除其他外，1）它有助于评估建立统计显著性所需的比较样本量，2）允许在不同类别的厚尾分布之间进行实际比较，3）有助于理解对数正态分布的一些不一致属性，取决于其尺度参数的参数化。有关渐近行为的文献非常丰富，但对于$n$的有限值，即用于操作目的的有限值，存在很大的空白。传统的厚尾性度量，即1）幂律类的尾部指数，以及2）有限矩分布的峰度，无法适用于某些分布，并且不允许跨类和参数化进行比较，即在列维稳定流域以外的幂律之间，或在其他类的分布之间，或在不同总和数的幂律之间。如何将100个三自由度学生T分布随机变量的总和与Levy稳定或对数正态类中的一个进行比较？一个人如何将一个有3个自由度的100个学生T的总和与一个有2个自由度的学生T的总和进行比较？我们提出了一个操作性和启发性的度量方法，允许我们在有限第一矩的所有分布下比较n$和的自变量。该方法基于有限和的大数定律的收敛速度，特别是n$-和。我们得到了对数正态分布、指数分布、帕累托分布和学生T分布在各种校准中的显式表达式或模拟结果和界，以及一般的Pearson类。
---
分类信息：

一级分类：Statistics 统计学
二级分类：Methodology 方法论
分类描述：Design, Surveys, Model Selection, Multiple Testing, Multivariate Methods, Signal and Image Processing, Time Series, Smoothing, Spatial Statistics, Survival Analysis, Nonparametric and Semiparametric Methods
设计，调查，模型选择，多重检验，多元方法，信号和图像处理，时间序列，平滑，空间统计，生存分析，非参数和半参数方法
--
一级分类：Quantitative Finance 数量金融学
二级分类：Statistical Finance 统计金融
分类描述：Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--

---
PDF下载：
-->

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

kedemingshi

2022-6-6 21:33:49

胖尾统计项目您需要多少数据？厚尾Nessnassim Nicholas TalebTandon工程学院的前渐近度量，纽约大学2018年11月即将出版的《国际预测杂志》（International Journal of ForecastingStract）本文提出了一个具有有限第一矩的单变量无模概率分布的操作度量，其中0为最大细尾（高斯），1为最大厚尾。它基于“一个人需要多少数据才能对给定数据库做出有意义的陈述？”应用：除其他外，它o有助于评估高斯分布以外的统计信号所需的样本量n，o有助于测量收敛到高斯分布（或稳定盆地）的速度，o允许对不同类别的胖尾分布进行实际比较，o允许评估投资组合构建中所需的证券数量，以实现一定程度的分散风险降低，o帮助评估各种设置下的风险，o帮助理解对数正态分布的一些不一致属性，取决于其方差的参数化。有关渐近行为的文献非常丰富，但对于n的有限值，即操作目的所需的值，存在很大的空白。背景：传统的厚尾性度量方法，即1）幂律类的尾部指数，以及2）有限矩分布的峰度，无法适用于某些分布，并且不允许跨类和参数化进行比较，即在列维稳定流域以外的幂律之间，或幂律与其他类的分布之间，或不同求和数的幂律。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-6-6 21:33:52

一个人如何将100个具有3个自由度的学生分布随机变量的总和与Levy稳定或对数正态类中的一个进行比较？佳能如何将一个有3个自由度的100个学生T的总和与一个有2个自由度的学生T的总和进行比较？我们提出了一个操作性和启发性指标，允许我们在第一时刻确定的所有分布中比较n个求和的独立变量。该方法作者最应归功于Michail Loulakis的重点评论，此外，他还为Student T和对数正态分布的κ极限提供了严格的推导，以及Spyros Makridakis的耐心和智慧。该论文最初于2016年9月12日至16日在莱顿洛伦茨中心和2017年10月在库兰特研究所吉姆·盖瑟尔的Festschrift发表，主题为《高维度的极端与风险》。作者感谢Jean-PhilippeBouchaud、John Einmall、Pasquale Cirillo和其他人。劳伦斯·德哈恩建议将指标名称从“gamma”改为“kappa”，以避免混淆。此外，感谢科尔曼·汉弗莱、迈克尔·劳勒、丹尼尔·杜弗雷恩和其他人对推导的讨论和见解。基于有限和的largenumbers定律的收敛速度，特别是n-和。我们得到了对数正态分布、指数分布、帕累托分布和学生T分布在各种校准中的显式表达式或模拟结果和界，以及一般Pearson类。Cauchy（κ=1）Pareto 1.14立方Student TGaussian（κ=0）Degrees of at Tailedness2 4 6 10 N246810|Sn=X1+X2++Xn |图1。κ测量的直观性：r.v.Sn的相同拷贝之和的平均偏差=X+X+。xn随着样本的增加，我们将讨论如何比较不同类别的前共感分布。我

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-6-6 21:33:55

导言和定义表明，我们可以将尾部α=2.1的帕累托分布与高斯分布进行比较吗？即，在方差有限的情况下，可以将其与高斯分布进行比较吗？渐进地，这些具有单位秒矩的规则变化类的分布在求和下变为高斯分布，但在预交感作用下，我们没有标准的方法来比较它们，因为依赖于更高矩的度量，如峰度，无法提供帮助。我们也无法将有限方差帕累托分布与其极限α稳定分布（当两者具有相同的尾部指数或尾部指数）进行比较。同样，我们如何将一个具有3个自由度的学生T的“厚尾”与一个尾部指数为1.95的LevyStable的“厚尾”进行比较？两种分布都有一个确定的平均值；在这两个变量中，只有第一个变量具有有限的方差，但根据一些操作标准，对于少数总和，其表现更为“厚尾”。“厚尾”指的是金融从业人员使用的通用术语，指的是比高斯分布更厚的尾，而不是指任何特定类别的分布。胖尾统计项目2κ1,30κ1100κ11000中心界限（κ1）1.0 1.5 2.0 2.5 3.0 3.5 4.0α0.00.20.40.60.81.0κ帕累托（α）κ1,30κ1100κ11.5 2.0 2.5 3.0 3.5 4.0α0.20.40.60.81.0κ学生T（α）图2。观察广义中心极限定理的效果：帕累托分布和学生T分布，在P类中，α指数，κ收敛到2- (α<2α +α≥22），或稳定的S级。我们观察到收敛速度有多慢，即使在1000个求和之后。这削弱了Mandelbrot的观点，即有限方差帕累托可以包含在稳定分布中。1） “厚尾性”标准：根据每个定义，有多种方法“定义”厚尾和等级分布。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

大多数88

2022-6-6 21:33:57

在所有矩有限的窄类分布中，是峰度，它允许简单比较并测量偏离高斯分布的情况，高斯分布用作范数。对于幂律类，它可以是尾部指数。也可以使用极值，取超过最大值的概率，通过量表进行调整（如极值理论中所实践的）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

大多数88

2022-6-6 21:34:02

对于操作用途，从业者的厚尾性是一种集中度，例如“有多少统计特性可归因于单个观察？”，或者，通过尺度（或平均离散度）适当调整，“一个国家的总财富掌握在最富有的个人手中有多少？”在这里，我们使用以下标准来衡量我们的目的，这与上一段中的浓度测量相吻合：“额外数据（在这种概率分布下）将在多大程度上有助于提高观察平均值的稳定性”。其目的并不完全是统计上的：它同样意味着：“在我的投资组合配置中增加额外的证券（即保持总不变）会在多大程度上增加其稳定性？”我们的度量与渐近度量（尤其是极值理论中使用的度量）的不同之处在于，它基本上是预交感的。现实生活和现实世界的实现都在渐近线之外。2）指标做了什么：我们提出的指标，κ做了以下工作：o允许比较n-对给定数量的求和变量进行不同分布的求和，或对不同n进行相同分布的求和，并评估给定分布的预交感性质提供与极限分布（即Lévyα-稳定盆地）的距离度量（高斯分布是其特例）对于统计推断，允许评估大数定律的“速度”，表示为由于样本量n的增加，平均绝对误差的变化。允许比较评估两种不同单变量分布的“厚尾性”，当两种分布都具有有限的第一时刻允许我们提前知道蒙特卡罗模拟需要多少次运行。3）统计推断的状态：最后一点“速度”似乎被忽略了。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

能者818

2022-6-6 21:34:06

因为在9400页的《统计科学百科全书》[1]中，我们能够找到一条关于达到渐近线所需时间的评论，或者如何处理n个大的总和，但对于所谓的“正态近似”来说可能不够充分。此外，关于StatisticalReference（由W.Hoefffing编写）的条目明确地回避了这个问题，声明：“统计数据的精确分布通常非常复杂，很难处理。因此，需要用一种更简单形式的分布来近似精确分布，其性质更为透明。概率论的极限定理为这种近似提供了重要工具。特别是经典的中心极限定理指出，大数之和rof独立随机变量在一般条件下近似正态分布。事实上，正态分布在可能的极限分布中起着主导作用。(...) 此外，许多统计量的行为类似于独立随机变量的和。所有这些都有助于解释正态分布作为渐近分布的重要性。“即使是社会科学对“小数定律”的讨论[2]也假设高斯属性为范数。至于极值理论，“小数函数定律”[3]涉及小概率的泊松碰撞；更普遍的是，极值理论（虽然自然配备了厚尾工具）关注maxima，notaverages的行为。我们的座右铭是“统计永远不是标准”。该指标旨在显示标准是如何成为标准的，胖尾统计项目3从统计意义的标准点测量与标准的准确偏差。二、METRICStudent T（3）或稳定α=1.7稳定α=1.2~ 高斯0.5 1.0 1.5 2.0 2.5 3.0σ0.20.40.60.81.0κ1Fig。3.

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-6-6 21:34:10

对数正态分布在σ值较低时表现为高斯分布，但很快就等价于幂律。这说明了为什么在操作上，关于财富分配是对数正态分布（Gibrat）还是帕累托分布（Zipf）的争论没有多少操作意义。定义1（κ度量）。让X，Xnbe i.i.d.具有有限平均值的随机变量，即E（X）<+∞. 设Sn=X+X+…+Xnbe部分和。设M（n）=E（| Sn-E（Sn）|）是n个总和与平均值的预期平均绝对偏差。定义n个额外总和的“收敛速度”，从n：κn开始，n=min（κn，n：M（n）M（n）=nn型2.-κn，n，n=1，2，…），n>n≥ 1，因此κ（n，n）=2-日志（n）-日志（n）日志M（n）M（n）. （1）此外，对于基线值n=n+1，我们使用Shorthandκn。我们还可以在约束条件下，按照类似于“本地”利率的“本地”中间值分解κ（n，n）。κ（n，n）=2-日志（n）-log（n）Pni=0 log（i+1）-日志（i）2-κ（i，i+1）。（2）平均偏差的使用：请注意，我们使用平均绝对偏差来衡量平均值周围的分散度，以便在没有有限方差的情况下保持在范数范围内–实际上，即使在存在有限方差的情况下，在幂律制度下，分布也会产生不稳定且无信息的二阶矩。平均偏差证明在那里更加稳健。（除了峰度等于3（高斯）的狭义情况外，平均绝对偏差可以显示为更“有效”，见[4]中更长的讨论；有关其他优点，请参见[5]。）三、稳定收敛盆地作为基准定义2（P类）。r.v.X的幂律P类（调节）定义如下：P={X:P（X>X）~ L（x）x-α} （3）其中~ 意味着rhs与lhs之比的极限为1，即x→ ∞. L:[xmin+∞) → (0, +∞) 是一个缓慢变化的函数，定义为limx→+∞L（kx）L（x）=1表示任何k>0。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

何人来此

2022-6-6 21:34:12

常数α>0。接下来，我们用相同的参数定义了同分布变量之和的吸引域。定义3。（稳定S类）随机变量X遵循稳定（或α-稳定）分布，符号为X~如果其特征函数χ（t）=E（eitX）的形式为：χ（t），则S（￠α，β，u，σ）=e（iut-|tσ|Иα（1-iβtan（π|α）sgn（t）））|α6=1eit（2βσlog（σ）π+u）-|tσ|（1+2iβsgn（t）log（| tσ|）π）~α=1，（4）接下来，我们定义相应的稳定▄α：▄α，（αα<2+2α≥2如果X在P2中，则为其他。（5）关于S类的进一步讨论如下。A、所有nand n的稳定分布的等价性≥ 稳定S类中的1，带▄α≥ 1： κ（n，n）=2- 仅仅从M（n）=nαM（1）（6）的性质来看，这简单地表明，对于高斯函数，κn，n=0。n个总和的前症状问题归结为：on=1的分布特性是什么（或从标准的现成分布开始）NSUMands的分发属性是什么κn如何→ 2.- ~α，以什么速率？B、样本充足率区间的实际意义：作为一种简单的启发式方法，κ越高，越不相称地不充分。上述κ的任何值。15有效地表明了“正态近似”的高度不可靠性。人们可能会立即怀疑众多厚尾领域研究论文的结果。例如，表II所做的排序计算允许我们比较各种参数化下的各种分布。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

可人4

2022-6-6 21:34:15

（比较各种帕累托分布与symmetricFAT TAILS统计项目4表IKAPPA FOR 2 SUMMANDS，κ。分布κStudent T（α）2-2日志（2）2日志2-αΓ(α-)Γ(α)!+对数（π）指数/伽马2-日志（2）2日志（2）-1.≈ .21帕累托（α）2-对数（2）对数（α-1)2-ααα-1Rα-1.-2α（y+2）-2α-1.α-1.-y由+2(-α,1-α)-截至1年+2月(-α,1-α)!dy！异常（u，σ），带切换方差σa w.p pb。2.-日志（2）日志√qapp公司-1+σ+p-2qapp-1+σ+pqapp公司-1+σ-r2ap-1+2+4σ+√a+σ+r2ap-1+2+4σp√a+σ-（p-1） qapp公司-1+σ对数正态分布（u，σ）≈ 2.-日志（2）日志2 erfrlogeσ+1√erf公司σ√.aB.（，.）是不完整的Beta函数：Bz（a，b）=Rzta-1(1 - t） b类-1dt；erf（.）是误差函数erf（z）=√πRze-tdt。bSee附录中的注释和推导，用于切换方差和平均值，因为它可能会产生kappa的负值。表II主要结果分布κnExponential/Gamma显式对数正态分布（u，σ）无显式κnbut显式下限上限（低或高σ或n）。用PearsonIV近似表示σ介于两者之间。κ的帕累托（α）（常数）显式（所有α的下界）。学生T（α）（slowlyvarying函数）明确表示κ，α=3。学生T，当然还有高斯函数，正如我们在导言中提到的那样，统计推断所需的样本大小是由n（总和的数量）驱动的。然而，大数定律经常在惯性条件下被引用；我们需要一个严格的样本量指标。许多论文在讨论财务问题时表示[6]使用有限方差作为厚尾的二元分类：尾部指数大于2的幂律被预测为“高斯盆地”的一部分，因此允许在财务应用中使用方差和其他此类指标。一个更自然的边界是金融应用的预期的不确定性[7]。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

能者818

2022-6-6 21:34:19

我们的指标可以如下所示：表II比较帕累托与学生T（相同的尾部指数α）α帕累托-帕累托-帕累托-学生-学生-学生-学生-学生κ1,30κ1100κ1,30κ11001.25 0.829 0.787 0.771 0.792 0.765 0.7561.5 0.724 0.65 0.631 0.647 0.609 0.5871.75 0.65 0.556 0.53 0.543 0.483 0.4512。0.594 0.484 0.449 0.465 0.387 0.3522.25 0.551 0.431 0.388 0.406 0.316 0.2822.5 0.517 0.386 0.341 0.359 0.256 0.2272.75 0.488 0.356 0.307 0.321 0.224 0.1893. 0.465 0.3246 0.281 0.29 0.191 0.1593.25 0.445 0.305 0.258 0.265 0.167 0.1383.5 0.428 0.284 0.235 0.243 0.149 0.1213.75 0.413 0.263 0.222 0.225 0.13 0.104. 0.4 0.2532 0.211 0.209 0.126 0.093让Xg，1，Xg，2，Xg，ngbe是一个具有平均u和尺度σ的高斯变量序列。设Xν，1，Xnu，2，Xnu，nν是一些其他变量的序列，这些变量被缩放为相同的M（1），即Mν（1）=Mg（1）=qπσ。我们将计算对应于给定ng的nν值。κnis表示大数定律下的收敛速度和κn→ 0，表示在中心极限下求和收敛到高斯的速率，如图2所示。胖尾统计项目5nmin=inf（nν：EnνXi=1Xν，i- mpnν!≤ EngXi=1Xg，i- mgng公司!, nν>0），可使用κn=0计算高斯分布，并使用simpleapproximation从κ计算目标分布：nν=n-κ1，ng-1克≈ n-κ-1g，ng>1（7）这种近似是由于收敛缓慢。例如，一个具有3个自由度（α=3）的学生T需要120次观察，才能获得与高斯平均值（即置信水平）相同的方差下降，这是高斯平均值30的4倍。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-6-6 21:34:22

具有相同尾部指数α=3的单尾帕累托需要543次观察，以匹配30个高斯样本，比学生多4.5倍，这表明1）方差的不确定性不是肥胖的迹象（在我们的统计意义上），2）尾部指数也不是很好的指标3）对称Student分布和Paretodistribution如何不等价，因为Student的“钟形”（来自缓慢移动的函数）抑制了分布中心的变化。我们还可以得出相当违反直觉的结果。根据公式7，流行思想中的“帕累托80/20”，它映射到α周围的尾部指数≈ 1.14，需要比高斯函数多观测10次以上。四、技术后果a。非对称分布的一些奇点稳定分布在倾斜时具有与对称分布相同的κ指数（换句话说，κ对等式4中的β参数是不变的，在求和时保持不变）。但单尾简单帕累托分布比等效对称分布的尾部更厚（我们在这里的目的是这样）。这是相关的，因为在实践中从未真正观察到稳定，并将其用作一些限制性的数学对象，而帕累托更常见。文献中没有很好地理解这一点。考虑以下使用稳定替代帕累托。在Uchaikin和Zolotarev【8】一文中，Mandelbrot提请注意这样一个事实，即使用极值稳定分布（对应于β=1）来描述经验原理比使用Zipf-Pareto分布更可取，原因有很多。从许多理论和应用出版物中可以看出，曼德尔布罗特的思想得到了专家们越来越广泛的认可。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

大多数88

2022-6-6 21:34:25

通过这种方式，希望之星在数学模型的框架中确认了经验性确立的原则，同时也澄清了这些原则的形成机制。即使是在夏天，这些动物也不一样。B、附录中显示了学生T分布到高斯基的收敛速度——由于α=3的学生和的κ的显式推导，金融界普遍注意到的“立方”分布——求和下κ到0的收敛速度很慢。n-求和立方体学生密度的半封闭形式可以补充Bouchaud和Potters[9]中的结果（另见[10]，如下所示）。他们的方法是分离“高斯区”，其中密度近似于高斯，以及尾部的“幂律区”，后者保留幂律递减的原始分布。“交叉”在中心的左右两个移动之间，以n个对数（n）的标准差的速度移动，速度非常慢。事实上，我们可以注意到，更多的和落在分布的中心，更少的落在分布之外，因此根据中心极限定理的收敛速度将根据密度是与中心有关还是与轨道有关而有所不同。进一步的研究将关注帕累托到列维稳定的收敛性，到目前为止，我们只得到了数字。C、对数正态分布既非细尾也非厚尾，如图II所示，在参数σ值较低时，对数正态分布表现为高斯分布，而在σ较高时，它似乎具有各种柯西分布（单尾柯西分布，α=1，β=1的稳定分布），因为κ越来越接近1。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-6-6 21:34:29

这给了我们一个关于某些变量是帕累托分布还是对数正态分布的争论的一些方面的想法，例如，关于财富的争论【11】、【12】、【13】。事实上，这种辩论可能与现实世界有关。正如P.Cirillo【14】所观察到的，许多异常情况都是具有高方差的对数正态情况；然而，实际的统计结果比想象的要小。D、 kappa能为负值吗？正如混合高斯的峰度（即具有随机平均值，而非随机波动率）可以下降到3以下（或当使用将峰度测量为超出高斯值的惯例时，将其加上3）一样，当峰度为“负”时，kappa度量可以变为负。这些情况需要双峰性（即，固定方差下均值之间的切换过程，模式在标准偏差方面相距很远）。它们似乎不会出现在单峰分布中。附录中给出了详细信息和推导。五、总结结论和结论，而极限定理（大数定律和中心极限）与→ +∞, 我们对小型和大型的有限和精确n（及其统计和风险影响）感兴趣。我们可以得出一些操作结果：厚尾统计项目6MarkowitzEstablishedSecurities投机证券0 200 400 600 800 1000n0.10.20.30.40.50.6变量图。简言之，为什么1/n启发式在投资组合理论（以及类似的决策问题）中有效：根据马科维茨的观点，需要更多的证券才能获得与通过投资组合分配相同的风险降低。我们假设这些证券是独立的，而它们不是，某种程度上加剧了这种效应。A.

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

何人来此

2022-6-6 21:34:32

投资组合伪稳定我们的方法也可以自然且立即地应用拓扑组合构建和多元化的效果，因为将证券添加到投资组合中具有与添加额外观察以达到统计意义相同的“稳定”效果。“您需要多少数据？”翻译成“你需要多少证券？”。很明显，现代金融中的Markowicz分配方法【15】（Markowitz本人似乎不会将其用于自己的投资组合【16】）仅适用于接近0的κ；人们使用ConverxEuristics，否则他们会低估尾部风险，并像1998年著名的以投资组合理论为导向的对冲基金长期管理那样“炸毁”。[17][18]我们之前提到，接近“80/20”的帕累托分布需要比高斯分布多10个观测值；考虑到如果使用现代投资组合标准，在这种分布下的投资组合风险将被低估至少8个数量级。按照这样的推理，我们只需要更广泛的投资组合。还注意到，从峰度的简单标准来看，实际上没有比高斯分布更厚的金融安全[19]，这意味着马科维茨投资组合分配永远不是最佳解决方案。代理明智地将噪声近似应用于启发式，行为科学家将其归类为这些偏见之一，但事实上被揭穿为错误（错误偏见是指，虽然观察到的现象存在，但并不构成“偏见在这个词的不好的意义上；相反，由于使用了错误的工具而不是决策者，研究人员才是错误的）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

kedemingshi

2022-6-6 21:34:35

Benartzi和Thaler[20]认为这种“过度多元化”的倾向背离了最优投资行为，并在[21]中解释道：“当面对n个期权时，将资产平均分配到期权上。我们将这种启发式称为“1/n规则”。“然而，扩大一个人的多样性有效性至少与标准分配一样最优（见Windcliff和Boyle的评论[22]和[23]）。简言之，在广泛的指标范围内，等权重投资组合的表现优于SP500。但即使是后两篇论文也没有考虑到胖尾巴的全部作用和特性，我们可以在这里看到一些精确的结果。图五显示了与马科维茨相比对证券的影响。这种错误的偏见是众多决策者“强迫”人们进入错误理性的例子之一，并迫使他们将投资组合风险增加了许多倍。关于金融投资组合风险的更多评论。SP500的κ约为。2，但需要考虑的是，它本身就是一篮子n=500的证券，尽管没有加权，而且由相关成员组成，对稳定股票的权重过高。单只股票之间有kappas。3和。7、意味着必须制定“过度驾驶”政策。同样，该指标在预测数据处理方面为我们提供了一些指导，通过建立样本效率，说明在说明气候条件是否“发生变化”之前，我们需要多少年的数据，见【24】。B、统计推断的其他方面到目前为止，我们只考虑了单变量分布。对于更高的维度，一个潜在的研究领域是肥胖变量的多元分布的等效方法，马尔琴科Pastur（或Wishhart）分布无法捕获其抽样。在我们的情况下，添加变量并不容易从随机矩阵中消除噪声。C

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-6-6 21:34:38

最后的评论正如我们前面所说，“统计从来都不是标准的”；然而，有一些启发式方法可以找出我们偏离标准的地方和程度。胖尾统计项目7附录A。立方学生T（高斯盆地）由于其在金融领域的普遍性，具有3个自由度的学生T在文献中特别受关注。由于方差的不确定性，它常常被错误地近似为高斯分布。渐近地，我们最终得到了阿高斯，但这并没有告诉我们任何关于收敛速度的信息。Mandelbrot和Taleb【25】指出，立方体更像是极端分布中的幂律，我们将在这里详细阐述，这要感谢thesum的明确PDF。设X是密度为p（X）：p（X）的随机变量=√π（x+3），x∈ (-∞, ∞) （8）提案1。设Y是X的和，Xn，n X的相同副本。设M（n）为n个总和与平均值的平均绝对偏差。收敛的“速率”κ1，n=nκ：M（n）M（1）=n2-κois：κ1，n=2-对数（n）对数（enn-nΓ（n+1，n）- 1）（9）其中Γ（，.）是不完全伽马函数Γ（a，z）=R∞zdtta公司-1e级-t、自平均偏差M（n）：M（n）=(√n=1时为π√π（enn-nΓ（n+1，n）- 1）对于n>1（10），推导如下。对于pdf和MAD，我们遵循不同的路线。我们有n个求和的特征函数：Д（ω）=（1+√3Ωne-n√3 |ω| Y的pdf由以下公式给出：p（Y）=πZ∞(1 +√3ω）ne-n√3ωcos（ωy）dω经过艰苦的积分，我们得到了10的结果。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nandehutu2022

2022-6-6 21:34:42

此外，由于文献中似乎没有找到以下结果，我们有一个副作用的结果：Y的PDF可以写成asp（Y）=en-iy公司√e2iy公司√E-nn+iy√+ E-nn-iy公司√√3π（11），其中E（.）(.) 是指数积分Enz=R∞et公司(-z） tndt。注意以下标识（来自Abramowitz和Stegun的更新）[26]n-n-1Γ（n+1，n）=E-n（n）=e-n（n- 1)!nnnXm=0nmm！关于渐近性，我们有以下结果（由Michail Loulakis提出）：重新表示等式10:M（n）=√3n！πnnn-1Xm=0nmm！此外，e-nn型-1Xm=0nmm！=+O√n（根据中心极限定理，泊松变量和收敛到高斯分布时的行为：e-nPn公司-1m=0nmm！=P（Xn<n），其中Xn是参数为n的泊松随机变量。由于n个独立泊松随机变量与参数1的和是参数为n的泊松随机变量，中心极限定理表示Zn=（Xn）的概率分布- n）/√n接近标准正态分布。因此P（Xn<n）=P（Zn<0）→ 1/2 asn→ ∞.关于另一种方法，请参见[27]，以证明1+n1+n2！+···+nn型-1（n-1)!~en.）使用limn→∞nexp（n）nn√n个=√2π，我们得到以下精确渐近：Robert Israel在数学堆栈上交换尾部统计项目8limn→∞log（n）κ1，n=π因此，在速度log（n）时，κ变为0（即，平均值变为高斯），速度非常慢。换句话说，即使有总结，这种行为也不能概括为高斯现象，这是B.Mandelbrot经常表达的直觉【25】。B、对数正态分布从n个和的累积量的行为中，我们可以观察到，当σ低时，和的行为类似于高斯分布，当σ高时，和的行为类似于对数正态分布——在这两种情况下，我们都明确知道κn。对数正态分布（用u和σ参数化）没有明确的特征函数。但我们可以通过递归得到所有阶数i的累积量kii，对于我们的情况，求和r.v的相同副本。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-6-6 21:34:45

Xi，Kni=Ki（PnXi）=nKi（X）。累积量：Kn=neu+σKn=neσ- 1.e2u+σKn=neσ- 1.eσ+2e3u+3σKn=。这让我们可以计算：偏度=√eσ-1.eσ+2e（2u+σ）-u-σ√nand峰度=3+e2σeσeσ+2+3.-6nw我们可以立即从累积量/矩中证明：limn→+∞κ1，n=0，limσ→0κ1，n=0，我们对κ的约束变得明确：让κ*1，nbe对数正态和保持对数正态密度的情况，前两个时刻相同。我们有0个≤ κ*1，n≤ 1,κ*1，n=2-日志（n）日志神经衰弱vuutlogn+eσ-1n！√erf公司σ√1）启发式尝试：在其他启发式方法中，我们可以通过两个步骤看到1）在σ，κ1，n的高值下→ κ*1，n，因为大数定律变慢了，2）κ*1，nσ→∞→ 1.2）Loulakis证明：证明了高方差κ1的上界，napproaches 1已正式显示在我的MichailLoulakis上，我们总结如下。我们从标识E（| X）开始-m |）=2R∞m（x- m） f（x）dx=2R∞m’FX（t）dt，其中f（.）是密度，m是平均值，FX（.）是生存函数。此外，M（n）=2R∞nm？F（x）dx。假设u=σ，或X=expσZ-σ其中Z是标准正态变量。设sn为X++Xn；我们得到M（n）=2R∞nP（Sn>t）dt。利用次指数性质（[28]），P（Sn>t）≥ P（最大值0<i≤n（Xi）>t）≥ nP（X>t）-nP（X>t）。现在P（X>t）σ→∞→ 1，第二项为0（使用霍尔德不等式）。跳过步骤，我们得到lim infσ→∞M（n）M（1）≥ n、同时，我们需要满足边界M（n）M（1）≤ n、所以对于σ→ ∞,M（n）M（1）=n，因此κ1，nσ→∞→ 1.3）皮尔逊族计算方法：为了计算目的，σ参数不太大（如下所示≈ .3、为了便于计算，我们可以使用Pearson族–虽然对数正态分布不属于Pearson类（正态分布属于Pearson类，但我们非常接近计算）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-6-6 21:34:49

直观地说，在低西格玛下，前四个矩是足够的，因为没有大的偏差；而不是在更高的西格玛下，保持对数正态分布是正确的方法。Pearson类在信息/通信理论等领域有着广泛的应用，其中有丰富的文献：关于对数正态变量的求和，请参见Nie和Chen[29]，Pearson IV[30]，[31]。Pearson族定义为满足以下微分方程的适当比例密度f。f（x）=-（a+ax）b+bx+bxf（x）（12）本文综述；Loulakis提出了一种形式化证明来代替启发式推导。胖尾统计项目9我们注意到，我们对a、b等的参数化确定了Pearson类内的分布，这似乎是Pearson IV。最后，我们得到了平均偏差的表达式，作为n、σ和u的函数。让m为平均值。Diaconis等人（32）根据铃木De Moivre（33）的一个老把戏表明，我们可以得到明确的平均绝对偏差。再次使用标识E（| X-m |）=2R∞m（x- m） f（x）dx和零件积分，E（| x-m |）=b+bm+bm一- 2bf（m）（13）我们使用n-和对数正态分布的累积量来匹配参数。设置a=1，m=b-a1级-2b，我们得到a=eu+σ-12n+（3-10n）e4σ+6（n-1） eσ+12（n-1） e2σ-（8n+1）e3σ+3e5σ+e6σ+12（6（n-1） +e2σ（eσ（5eσ+4）-3））b=e2σeσ-1.2eσ+3（6（n-1） +e2σ（eσ（5eσ+4）-3））b=eσ-1.eu+σeσeσeσ-4n+eσeσ+4+7.-6n+6+6（n-1)+12（n-1)（6（n-1） +e2σ（eσ（5eσ+4）-3））b=-neσ-1.e（u+σ）eσ-2（n-1） eσ-3n+e3σ+3+6（n-1)（6（n-1） +e2σ（eσ（5eσ+4）-3） 4）多项式展开：其他方法，如Gram-Charlier展开，如Schleher[34]，Beaulieu[35]，证明对获得κn没有帮助。在σ值较高时，由于我们包括高阶lhermitpolynomic，近似变得不稳定。参见Dufresne[36]和[37]中的评论。C

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

mingdashike22

2022-6-6 21:34:54

指数指数是“入门级”厚尾，就在边界处。f（x）=λe-λx，x≥ 通过卷积，Z=X，X。Xnwe通过递归获得，因为f（y）=Ryf（x）f（y- x） dx=λye-λy:fn（z）=λnzn-1e级-λz（n- 1)!（14）这是伽马分布；我们得到n个总和的平均偏差：M（n）=2e-nnnλΓ（n），（15）因此：κ1，n=2-日志（n）n日志（n）- n- log（Γ（n））+1（16）虽然指数分布位于次指数的尖端，但我们可以看到渐近行为同样缓慢（与学生相似）：limn→∞对数（n）κ1，n=4- 2对数（2π）厚尾统计项目10D。负kappaConsider具有切换均值和方差的高斯的简单情况：具有概率，X~ N（u，σ）和with概率，X~ N（u，σ）。峰度将为3-(u- u)- 6.σ- σ(u- u)+ 2 (σ+ σ)（17）正如我们所见，峰度是d=u的函数- u. 对于σ=σ，u6=u的情况，峰度将低于正则高斯函数，我们的度量值自然为负。事实上，如果峰度保持在3以上|≤√pmax（σ，σ）- min（σ，σ），均值的随机性抵消了波动的随机性。这些尾部比高斯细的情况会遇到双峰情况，其中u和u是分开的；当它们被几个标准差分开时，影响会变得很严重。设d=u-u和σ=σ=σ（达到最小峰度），κ=log（4）log（π）- 2个日志√πded4σerf（d2σ）+2√σed4σ+2σded4σerfd√2σ+2.√πσed8σ！+2（18）对于u的宽值，我们看到为负值- u.胖尾统计项目11参考文献[1]S.Kotz和N.Johnson，《统计科学百科全书》。Wiley，2004年。[2] A.Tversky和D.Kahneman，“相信小数定律”《心理通报》，第76卷，第2期，第105页，1971年。[3] M.Falk、J.Hüsler和R.-D.Reiss，《小数定律：极值和罕见事件》。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nandehutu2022

2022-6-6 21:34:57

Springer Science&Business Media，2010年。[4] N.N.Taleb，《技术创新》第1卷：尾部、论文和评论的统计结果。专著，2018年。[5] T.Pham Gia和T.Hung，“平均值和中值绝对偏差”，《数学和计算机建模》，第34卷，第7-8期，第921-9362001页。[6] X.Gabaix，“经济和金融中的幂律”，国家经济研究局，技术代表，2008年。[7] N.N.Taleb，“方差的有限性与定量金融实践无关”，复杂性，第14卷，第3期，第66–76页，2009年。[8] V.V.Uchaikin和V.M.Zolotarev，《机会与稳定性：稳定分布及其应用》。Walter de Gruyter，1999年。[9] J.-P.Bouchaud和M.Potters，《金融风险理论和衍生定价：从统计物理学到风险管理》。剑桥大学出版社，2003年。[10] D.Sornette，《自然科学中的关键现象：混沌、分形、自组织和无序：概念和工具》。斯普林格，2004年。[11] B.Mandelbrot，“帕累托征税法与收入分配”，《国际经济评论》，第1卷，第2期，第79-106页，1960年。[12] C.Dagum，“收入分配与应用之间的不平等衡量”，《计量经济学》，第48卷，第7期，第1791-1803页，1980年。[13] --，收入分配模型。威利在线图书馆，1983年。[14] Cirillo，“你的数据真的是帕累托分布的吗？”《物理学A：统计力学及其应用》，第392卷，第23期，第5947-59622013页。[15] H.Markowitz，“投资组合选择*，《金融杂志》，第7卷，第1期，第77-911952页。[16] H.Neth和G.Gigerenzer，《启发式：不确定世界的工具》，《社会和行为科学的新趋势：跨学科、可搜索和可链接的资源》，2015年。[17] 塔勒布，《游戏中的皮肤：日常生活中隐藏的不对称》。企鹅（伦敦）和兰登书屋（纽约），2018年。[18] E.O。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

kedemingshi

2022-6-6 21:35:01

Thorp，“有利游戏的最佳赌博系统”，《国际统计研究所》（Revuede l\'Institut International de Statistique），第273–293页，1969年。[19] N.N.Taleb，“误差、稳健性和第四象限”，《国际预测杂志》，第25卷，第4期，第744-7592009页。[20] S.Benartzi和R.H.Thaler，“固定贡献储蓄计划中的朴素多元化战略”，《美国经济评论》，第91卷，第1期，第79-982001页。【21】S.Benartzi和R.Thaler，“退休储蓄行为中的启发式和偏见”，《经济展望杂志》，第21卷，第3期，第81-1042007页。[22]H.Windcliff和P.P.Boyle，“1/n养老金投资难题”，《北美精算杂志》，第8卷，第3期，第32-45页，2004年。[23]V.DeMiguel、L.Garlappi和R.Uppal，“最优与幼稚的多元化：1/n投资组合策略的效率如何？”《金融研究评论》，第22卷，第5期，第1915-1953页，2007年。[24]S.Makridakis和N.Taleb，“低水平可预测性下的决策和规划”，2009年。[25]B.B.Mandelbrot和N.N.Taleb，“随机跳跃，而非随机行走”，2010年。[26]“NIST数学函数数字图书馆”http://dlmf.nist.gov/，2018-06-22第1.0.19版，f.W.J.Olver，A.B.Olde Daalhuis，D.W.Lozier，B.I.Schneider，R.f.Boisvert，C.W.Clark，B.R.Millerand B.V.Saunders，eds.[在线]。可用：http://dlmf.nist.gov/【27】D.J.纽曼，问题研讨会。Springer Science&Business Media，2012年。[28]E.Pitman，“次指数分布函数”，J.Austral。数学Soc。序列号。A、第29卷，第3期，第337-3471980页。【29】H.Nie和S.Chen，“ivpearson型分布的对数正态和近似”，《IEEE通信快报》，第11卷，第102007号。【30】S.Chen、H.Nie和B.Ayers Glassey，“具有iv型皮尔逊分布变体的对数正态和近似”，IEEE CommunicationsLetters，第12卷，第9期，2008年。【31】M.Di Renzo，F。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

可人4

2022-6-6 21:35:06

Graziosi和F.Santucci，“通过pearson iv型分布逼近对数正态功率和的进一步结果：对数矩计算的一般公式”，IEEE通信事务，第57卷，第4期，2009年。[32]P.Diaconis和S.Zabell，“经典分布的封闭式求和：德莫伊夫主题的变化”，《统计科学》，第284-3021991页。【33】G.Suzuki，“pearsontype分布平均偏差的一致估计量”，《统计数学研究所年鉴》，第17卷，第1期，第271-2851965页。[34]D.Schleher，“广义gram-charlier级数及其在对数正态变量（corresp.）总和中的应用”，“IEEE信息论学报，第23卷，第2期，第275-280页，1977年。【35】N.C.Beaulieu、A.A.Abu Dayya和P.J.McLane，“估计独立对数正态随机变量之和的分布”，通信，IEEE交易，第43卷，第12期，第2869页，1995年。[36]D.Dufresne，“对数正态和”，第43届精算研究会议录。里贾纳大学，2008年。[37]D.Dufresne等人，《金融和其他计算中的对数正态近似》，《应用概率进展》，第36卷，第3期，第747-7732004页。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群