全部版块 我的主页
论坛 经济学论坛 三区 经济社会统计专版
86956 11
2014-11-25
偏度这一指标,又称偏斜系数、偏态系数,是用来帮助判断数据序列的分布规律性的指标。
      在数据序列呈对称分布(正态分布)的状态下,其均值、中位数和众数重合。且在这三个数的两侧,其它所有的数据完全以对称的方式左右分布。
      如果数据序列的分布不对称,则均值、中位数和众数必定分处不同的位置。这时,若以均值为参照点,则要么位于均值左侧的数据较多,称之为右偏;要么位于均值右侧的数据较多,称之为左偏;除此无它。
      考虑到所有数据与均值之间的离差之和应为零这一约束,则当均值左侧数据较多的时候,均值的右侧必定存在数值较大的“离群”数据;同理,当均值右侧数据较多的时候,均值的左侧必定存在数值较小的“离群”数据。
      一般将偏度定义为三阶中心矩与标准差的三次幂之比。
        在上述定义下,偏度系数的取值无非三种情景:
       1.当数据序列呈正态分布的时候,由于均值两侧的数据完全对称分布,其三阶中心矩必定为零,于是满足正态分布的数据序列的偏度系数必定等于零。
       2.当数据序列非对称分布的时候,如果均值的左侧数据较多,则其右侧的“离群”数据对三阶中心矩的计算结果影响至巨,乃至于三阶中心矩取正值。因此,当数据的分布呈右偏的时候,其偏度系数将大于零。
       3.当数据序列非对称分布的时候,如果均值的右侧数据较多,则其左侧的“离群”数据对三阶中心矩的计算结果影响至巨,乃至于三阶中心矩取负值。因此,当数据的分布呈左偏的时候,偏度系数将小于零。
       在右偏的分布中,由于大部分数据都在均值的左侧,且均值的右侧存在“离群”数据,这就使得分布曲线的右侧出现一个长长的拖尾;而在左偏的分布中,由于大部分数据都在均值的右侧,且均值的左侧存在“离群”数据,从而造成分布曲线的左侧出现一个长长的拖尾。
       可见,在偏度系数的绝对值较大的时候,最有可能的含义是“离群”数据离群的程度很高(很大或很小),亦即分布曲线某侧的拖尾很长。
       但“拖尾很长”与“分布曲线很偏斜”不完全等价。例如,也不能排除在数据较少的那一侧,只是多数数据的离差相对于另一侧较大,但不存在明显“离群”数据的情景。所以,为准确判断分布函数的偏斜程度,最好的办法是直接观察分布曲线的几何图形。
与偏度(系数)一样,峰度(系数)也是一个用于评价数据系列分布特征的指标。根据这两个指标,我们可以判断数据系列的分布是否满足正态性,进而评价平均数指标的使用价值。一般地,对于一个偏态分布、肥尾分布特征很明显的数据序列来说,平均数这个指标极易令人误解数据序列分布的集中位置及其集中程度,故此使用起来要极其谨慎。


峰度(系数)等于数据序列的四阶中心矩与标准差的四次幂之比。设若先将数据标准化,则峰度(系数)相当于标准化数据序列的四阶中心矩。
显然,一个数据距离均值越远,其对四阶中心矩计算结果的影响越大。是故,峰度(系数)是一个用于衡量离群数据离群度的指标。峰度(系数)越大,说明该数据系列中的极端值越多。这在数据序列的分布曲线图中来看,体现为存在明显的“肥尾”。当然,峰度(系数)较大也可能说明离群数据取值的极端性很严重,或者各数据距离均值的距离普遍较远。可见,峰度(系数)的大小到底能说明什么问题,最好还是看图确定。
根据Jensen不等式,可以确定出峰度(系数)的取值范围:它的下限不会低于1,上限不会高于数据的个数。
有一些典型分布的峰度(系数)值得特别关注。例如,正态分布的峰度(系数)为常数3,均匀分布的峰度(系数)为常数1.6。在统计实践中,我们经常把这两个典型的分布曲线作为评价样本数据序列分布性态的参照。
在金融学中,峰度这个指标具有一定的意义。一项金融资产,设若其预期收益率的峰度较高,则说明该项资产的预期收益率有相对较高的概率取极端值。换句话说,该项资产未来行市发生剧烈波动的概率相对较高
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-11-25 10:36:37
多谢分享!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-11-26 19:07:13
讲解的挺全面的,就是如果能再配上公式就更好啦!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-11-26 20:15:39
ofse 发表于 2014-11-26 19:07
讲解的挺全面的,就是如果能再配上公式就更好啦!
公式当前教材都有,就没有列出,但觉得都侧重于推导,侧重于数理,而这个讲解从实用角度解释了偏度与峰度,即这两个指标侧重于对图形的描述,在计算出具体的偏度与峰度后,更主要是要参考图形来分类分析,而不是单纯依照数值简单判断。
其二,根据这两个指标的分类,使用者可以按照自己的需求在原公式的基础上编程时再细化,即把图形数据化(因为如果数据量很大的话每个都要附上图形,计算机能受得了,但分析者还不得累死),这样得出的结果更有助于分析归纳,否则单单依靠原公式,分析归纳的难度有些大。
第三,这两个指标都是基于均值、标准差而来的,所以分析时可以根据均值与标准差来判别长尾属于哪种类型,从而确定其影响。
具体使用方法大家百度一下“收入分配公平性的偏态分布描述方法研究”这篇论文,就是偏度与峰度在实际问题中具体应用
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-11-28 17:07:28
感谢分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-12-20 23:00:09
怎么感觉举得例子讲解错误,不是峰度越高,数据越集中,推测未来发生剧烈波动的概率应该越小嘛?求证
“在金融学中,峰度这个指标具有一定的意义。一项金融资产,设若其预期收益率的峰度较高,则说明该项资产的预期收益率有相对较高的概率取极端值。换句话说,该项资产未来行市发生剧烈波动的概率相对较高”
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群