只有在完整的长周期才会有股价涨幅的正态分布
于德浩
2020.4.5
在有效市场理论中,股价涨幅的分布是正态分布,可以是任意连续的时间截断,只要是数据量足够多。但在数据实证中,我发现,只有在一个完整的长周期,才能有完备的涨幅正态分布。
用Excel软件分析数据。从2005.6月到2014.3月,这106个数据月线图。看一下频数分布的柱状图,基本是完备的正态分布。

这个长周期,是2005年的历史最低点到2014年的历史最低点。50ETF股价从最低初态的0.700元先上涨到最高4.670元,然后下跌到末态最低1.464元。 初态到末态,累计1.464/0.700=2.09倍。在106个月线图事例中,期望值是+1.10%,标准差是9.41%。
期望值附近,频数18与17近似相等;左边三组13+6+7与右边三组15+9+2也相等。所有的事例都在正负3X以内。左边1X以外有15个事例,右边1X之外有13个事例;正态分布的理论值是106*0.16=17个;这基本一致。左边2X以外有2+2=4个事例,右边2X以外有2+1=3个事例;理论值是106*0.025=2.65个;这也基本一致。
而如果我们统计连续120个月的数据,2005.6月-2015.5月,就与正态分布有明显不同。

这实际是一个完整的长周期又加上另一个周期的前14个月,组成了连续的120个月的数据事例。
这里统计的期望值是月涨幅+1.65%,标准差9.63%。但是,在期望值附近频数18与24明显相差太多,左侧三组16+9+8与右侧三组13+8+5也相差过大。 左侧1X之外有16个事例,右侧1X之外有16个事例,理论值120*0.16=19。 左侧2X之外有4个事例,右侧有2个事例,理论值是120*0.025=3个事例。
有效市场理论认为,随便截取一段子样事例,都应该有正态分布。这就相当于默认事例是均匀混合的,或者事例是时序无关的。但显然,股价涨幅分布的事例不是时序无关的。
比方说,一个仓库里的所有小球,是红球和绿球各占一半。这有100个麻袋装着,但每一个麻袋里的红绿比例不一定是1:1。或者说,1个或2个仓库的所有小球是红绿各占一半;但是1个仓库又1/10个仓库,可未必是各占一半。
在一个长周期中,股价运行有两个约束条件,一个是股价涨幅分布是正态分布的约束,另一个是,股价分布是黑体辐射分布的约束。有效市场理论,只看到了其一。
比方说,在股价是0.700元的最低点,如果只有第一个约束,那么股价还有下跌的50%可能;同理,股价在最高4.670元时,若只有第一个约束,那么也有继续高涨的50%可能。 但是,在加上第二个约束条件后,最低价再下跌与最高价再上涨的概率就被约束为0。
用价值投资理论来看,就是,股价必然有被高估和低估的时候,但最低价大约是8倍市盈率,不会更低;最高价大约是40倍市盈率,不可能高到天上去。
当然,现实中,价值投资估计的不太准,但这个大体的约束条件总是存在的。就是在初态到末态的等效矢量中,现实路径是初态到最高价,与最高价到末态最低价的两个矢量之和。
初态-末态的平均涨速就是,股价涨幅分布的期望值。比如,每年平均上涨+8%,十年累计就是最后2倍总收益。 一般来说,这个每月平均上涨+1%的趋势线,就是长周期股价运行的很强的支撑线。
股价运行的实际路径,应该是牛市中围绕初态-预估最高点这个上行矢量的周围。在熊市中,是围绕最高点-末态的下行矢量周围。也就是,在长周期的前期牛市中,每月的平均涨速应该是更高的约+2%以上。
在已经统计得知上一个周期的涨幅分布以后,可以对当前的运行周期,给予指导。看一下当前2014-2020年这·前半个周期的情形。

这里,我们暂时统计到,期望值是+1.09%,标准差是7.24%。左侧三组是9+8+5,右侧三组是10+3+2。我们知道未来,分布是大体对称的。也就是,在未来,右侧正值大的月涨幅要再多出7个月的事例才行。这就建议我们,当前应该持股待涨。
从另一方面看,比较上一个长周期的期望值+1.10%,标准差9.41%。当前这个前半周期的期望值应该在+2%以上才对。 这也意味着,未来应该有更多的正涨幅出现,也建议我们应该现在买入,持股待涨。