数据实证,连续n天的股价日涨幅分布不是正态分布
于德浩
2020.4.28
在股价布朗运动的模型中,股价涨幅的分布应该是正态分布。在下面的数据实证中,定性上,可以看成是正态分布。比方说,期望值附近的中间事例占比很多,两边占比很少,且比较对称。但定量上看,股价日涨幅分布与正态分布明显不同。
下面是50ETF股价在2019.2.25-2020.2.28一年的247个交易日的涨幅数据。

这里统计的50ETF在一年的累计涨幅约10%,是一个震荡的小牛市。股价日涨幅分布的期望值是0.04%,标准差是1.32%,合年化波动率21%。
定量上看,在(-0.33X,+0.33X),股价日涨幅分布占比是113/247=0.46;而正态分布的占比是(0.63-0.5)*2=0.26。实际的股价涨幅分布要比正态分布更集中。
在(+1X,+2X)区间,股价日涨幅分布占比18/247=0.07;而正态分布的占比是0.135。这仅有正态分布的一半。
在+2X以外,股价日涨幅分布占比7/247=0.028,这与正态分布的占比相当。
对于极端事例,在+4X及-4X以外各有一个日涨幅超过5%的事例。就是说,在一年之内,总会出现一根+5%以上的日收盘巨大长阳线。但,也说明,如果最近几个月出现过巨大长阳线,那么再出现巨大长阳线的可能性就是0了。 就是说,在日内再出现+5%的高点时,应该反向做空才对。 当然了,这种机会是很少的,一年才出现一两次。
从一年的常态分布来看,即使是牛市,日涨幅期望值也不过是0.2%,(这可是一年累计上涨+50%的大牛市),而标准差是1.3%,每天上涨的概率也不过是56%。所以,明天上涨的概率与瞎猜的50%差不多。
在牛市中,之所以能有累计的正涨幅,主要原因是(+0.5%,+1%)的中阳线相对较多。其它的很大的正涨幅及负涨幅,基本对称相抵消。而且,在+1X之外的,也就是大于+1.5%的日涨幅,是占比稀少的10%。 也就是,即使在未来一年牛市中,也不要企望每天都是长阳线。
股价的日涨幅分布中,(-0.4%,0)是最大概然值,比(0,+0.5%)的概率要大。即使在牛市中,每天也是-0的小跌幅居多; 这也是很多股民拿不住股票的根本原因。因为表面看,他总感觉,下跌的天数更多,与想象中的牛市不一样。
日涨幅大涨大跌基本是对称抵消的,而且出现的概率也很小。大于+2%及小于-2%实际是很稀少的,不要老是企盼。 而且,大涨过后,往往是大跌,一般起不到净正涨幅的作用。
我们现在想一下,为什么日涨幅分布不是正态分布呢? 根据中心极限定理,只要是子分布存在有限期望值及有限方差,且相互独立,那么子分布之和的分布就应该是正态分布。我们把日涨幅分布看成是16个15分钟涨幅的分布之和。 显然,这里只有一个条件可能不成立,那就是这16个子分布不相互独立。
也就是说,日内股价走势,是有关联的,是可以找寻到某些规律的。现在,想想西蒙斯的大奖章基金,做日内交易套利,还是很有可能成功的。当然,即使存在规律,未必你能发现,未必你能应用的好。 所以,很多国内的日内交易量化基金不赚钱也是很正常的。
股价涨幅的月分布是20个日涨幅分布之和,如果月涨幅分布是正态分布,那么就说明日涨幅分布之间是近似无关联的。当然,这还不是一个充分且必要的条件。应该说,日涨幅分布无关联,一定会推出月涨幅是正态分布。但,若月涨幅是正态分布,如果日涨幅又是时序无关的排列,才能说明日涨幅之间无关联。