《黑天鹅》书摘 高斯分布VS曼德尔布罗特分布
假如必须以一句话来表示这一理论,那就是:随着偏离中心(也就是平均值),可能性的下降速度便急剧增长。
《黑天鹅》
通过昨天的讨论,我们体会到了极端斯坦的极端分布,造成这种分布的原因就是可突破性。
我们回顾之前第三章讨论的平均斯坦和极端斯坦,平均斯坦的特征就是不可突破,受到物理限制,比如人的身高,100个人里面,姚明在里面,对整体的平均身高影响微乎其微,绝无可能出现一个能影响100人平均身高的超级巨人,但极端斯坦的特征就是可突破不受物理限制,一般可信息化的事物大多属于极端斯坦,比如我们昨天讨论的财富,100个人里,马云在里面他的财富对整体样本影响就巨大,甚至另外99人加起来也没他一人多。
我们今天着重讨论这两种不同的分布,平均斯坦类似身高这样的分布满足今天要讨论的高斯分布,而极端斯坦的分布就是我们昨天说的可突破分布,我们今天先称它为曼德尔布罗特分布。
我们先看满足高斯分布的平均斯坦,男女的平均身高为1.67米,当身高以10厘米为单位对平均值偏离,我们会发现概率是加速减小(注意是加速),身高1米77 的人占6分之一,1米87占44分之一,1米97占740分之一,2米07占32000分之一,2米17占350万分之一,2米27占10亿分之一,2米37占7800亿分之一。
我们注意到了,在每增加一个单位对平均值的偏离,可能性是呈加速下降的趋势,这种加速下降的概率是像高斯分布这样非突破性分布的主要特征,如果我们画成分布曲线就是如附图中那个倒U字形的曲线,我们从这个曲线可以看到主要的数值是集中在以平均值为中心的两边,而往两边的延伸非常陡峭,代表越偏离平均值可能性在加速变小,这种曲线我们称为钟形曲线,其代表的分布,我们称为高斯分布,又叫正态分布。
我们再来看极端斯坦的曼德尔布罗特分布,以欧洲人的财富分布来做观察,净资产100万欧元占63分之一,净资产200万占250分之一,净资产400万占1000分之一,800万占4000分之一,1600万占16000分之一,3200万占64000分之一,3.2亿占640000分之一。
从上面的分布我们注意到,金额每翻一倍,概率都是原来的1/4,也就是说,概率下降的速度是固定的,并没有出现下降的加速。
我们发现,在平均斯坦,对于突破性事件,有一种强大的阻力阻止它发生的可能,他受到局限,有一种阻力让事物迅速慢下来,但是在极端斯坦,就没有这种阻力让突破性事物趋势慢下来。
说到这里,我们都知道了,金融市场具备可信息化的属性,这里和财富分布一样是可突破的极端斯坦,但是现代金融理论定义风险的基础就是这种高斯分布,我们选基金用的夏普比率、定投指数时用的分位标准差都是建立在高斯分布的概念上。
塔勒布在德国机场转机的时候无意当中看见了10德国马克上的数学家高斯以及旁边的钟形曲线,不禁感叹,德国马克是最不符合钟形曲线的,因为20世纪20年代的时候,德国马克的汇率从1美元兑换4马克在短短两年时间变成了1美元兑换4万亿马克,这可不是高斯分布能够解释的。
按照高斯分布,在本书第一章1987年的大崩盘,以及类似的那些大崩盘也属于全宇宙寿命下都不可能发生的事情,但高斯分布只关注平均值,将不可预测的极小概率事件全部当做附属问题,但是,在极端斯坦里这种小概率事件恰恰是能影响全局的事情。因此,塔勒布认为高斯分布就好像只看见了小草却看不见大树。
简单说来,我们今天只需要记住,比平均值的离散程度越大的事件概率加速下降,是高斯分布的特征,这种分布在描述可突破的极端斯坦时,将那些可以影响全局的小概率事件排除在外了,这种分布特别关注那99人的财富平均数,将那一个马云选择性的忽略。而这种高斯分布正是现代金融的风险管理工具,因此那些在平均值中长期累积起来的隐藏风险和那些不可预知的风险都不在这种模型里,像1987年的美股崩盘,1997年的泰铢崩盘这些突发事件都不在主流的金融模型中。
那么,相对于今天讨论的高斯分布,我们也讨论了能更好描述极端斯坦突破属性的曼德尔布罗特分布,这位曼德尔布罗特又是何方大