为什么会有马尔可夫过程
于德浩
2019.5.7
这篇文章是上一篇《股票价格的布朗运动》的补充。马尔可夫过程,是指一个随机运动的末态与很久远的初态无关,只与最近的状态相关。
一组随机数满足正态分布,如果是纯数学性质的,那么就有非常好的事例非相干性,没有时序性;而如果对应一个物理过程,相邻事例总是相干的,具有时序性。比方说,有20个数据点满足正态分布,期望值是0,标准差是1。如果是数学性质的随机数,若第一个观测值是-2,你猜第二个观测值及第20个观测值。你应该估计第二个值为0,第20个值也为0,因为0是最大概然值。
如果这20个数据,对应一个物理时序过程。若第一个观测值是-2,你猜第二个及第20个观测值。你应该估计第二个值为-1.5,因为从-2跳到-1.5比较现实,不大可能一下子跃迁到0;而第20个值,你应该估计为0,最大概然值。其实,不论你看到的第一个观测值是-2,还是+2,还是0.3,你都应该估计第20个观测值为0,这就是期望值的意义所在。而如果估计第二个观测值,你应该分别估计为-1.5,+1.5,0;这是与前一个数据紧密相关的。
马尔可夫过程存在的原因是因为受到高斯分布的定域完备性约束。我们以牛市中股价的上涨过程为例。我们假定,每月股价大约平均上涨+4%,每天波动1%,每月波动4%。如果股价从原点0%出发,平均来言,在第20天,这个周期末的落脚点应该在+4%处附近。
具体到微观路径,考虑到定域完备,第20天末态也有可能落在0%或者8%的左右一个标准差位置。如果前期,股价上涨很快,在0%-4%的期望值左侧空间只停留4天,定域完备的理论值应该是7天。如果后面股价在4%-10%处已经停留有8天,此时股价应该快速下跌2天至4%附近,然后再跌3天进入到期望值左侧区域。这最后的下跌3天,就有可能收盘至0%了。虽然,最后的20天落脚点在0%,是期望值+4%处的左侧一个标准差,但是,股价量子态填充却是完美的高斯分布。所以,当开启下一个20天股价运行周期时,就可以干净利索的以此为新的原点。也就是,只要第一个20天周期满足高斯分布定域完备,不论收盘点是0%或+2%或7%或-3%等等,第二个周期完全不受第一个周期的影响。
如果是第一个20天周期,期望值左侧运行5天,右侧运行15天,明显不满足定域完备。那么下一个20天周期,极有可能来回填那些可能的空缺量子态,这就是二阶马尔可夫过程。
不过现实中,我们很难区分两个周期的分界线。比方说,股价在10个交易日内大幅上涨12%。也许这是一个周期内;也许前面4天属于上一个周期,后面6天才是开启新的周期。在牛市中,下一个周期的期望值一般都要大于上一个周期的期望值。判断上一个周期的期望值的最好方法,就是最近一个高点下面附近的成交密集区。
也就是说,在牛市中,当股价刚从回调底部反弹至前一个成交密集区时,这还远没到止盈点;只有当股价创新高并超出一大截时,才是止盈点。一般来说,按照一个周期4%的标准差,一段上涨至少有10%的最大涨幅;而回调下跌也一般要超过6%。所以,当一个波段的最大涨幅不到10%时,不要止盈;同理,当回调少于6%时,也不要急于补仓。
当然牛市中,要保持50%的持仓待涨,这是大智慧。股价是极有可能一窜而上的。
马尔可夫过程,由于周期内的定域完备性,股价短期涨幅过大,必然会碰壁下跌。一般20天要填满10%的涨幅空间,可前10天就到10%处了,后面也就只能下跌回填了。当某个价格区间持续的天数不多时,这往往是股价回填的一个诱因。
随波逐流的事物往往具有马尔可夫过程。比方说,一小勺食盐的溶解扩散过程。N个钠离子,在一段时间后,总会有一部分跑到很远的地方,然后在新的原点开始扩散。不论初始位置在哪儿,最后的状态就是均匀混合的盐水,钠离子在三维的水域空间是平均分布的。 而不溶于水的碳酸钙粉末就不是马尔可夫过程。它们就会沉淀在瓶子底部,应该是一个二维的高斯分布,初始位置点附近最多,越往外越稀少。
从更大处看马尔可夫过程,就是要长期持股,忽略短期波动。不管你现在是10元买入股票,还是12元买入,当时看好像差好多;但20年后,股价都是200元。就是说,只要你买了股票,并拿住了;二十年后,你就是至少翻16倍的大赢家。如果当初,斤斤计较贵了20%而没买,或者股价刚涨了1倍就很快卖出了,这就是战略大方向上的错误。