时间序列作为一门必须课,很多同学都逃不过~~他应用广泛,但也是学习难点多多。楼主近期再一次接触这们课程,打算借本版做一个学习笔记,让自己能够梳理知识,也为大家提供点参考和讨论话题,话不多说,开始……
本期的主题如下
1、什么是时间序列?
2、什么是时间序列平稳(严平稳,宽平稳)?
3、如何判断序列是平稳的?(此部分是重点)
先从第一个问题说起:什么是时间序列:
时间序列是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列。
什么是严平稳:
是在固定时间和位置的概率分布与所有时间和位置的概率分布相同的随机过程。这样,数学期望和方差这些参数也不随时间和位置变化。(比如白噪声)
什么是宽平稳:
宽平稳是使用序列的特征统计量来定义的一种平稳性。它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。
两者关系:
一般关系:严平稳条件比宽平稳条件苛刻,通常情况下,严平稳(低阶矩存在)能推出宽平稳成立,而宽平稳序列不能反推严平稳成立。
特例:不存在低阶矩的严平稳序列不满足宽平稳条件,例如服从柯西分布的严平稳序列就不是宽平稳序列。当序列服从多元正态分布时,宽平稳可以推出严平稳。
如何判断序列是平稳的?
咱们这次先从图形法上看(通常越是简单的方法,往往越能看到问题,图形给出的第一感觉也许就是真相哦~~~~)
时序图,例如(eviews画滴):
分析:什么样的图不平稳,先说下什么是平稳,平稳就是围绕着一个常数上下波动。
看看上面这个图,很明显的增长趋势,不平稳。
我们还可以根据自相关和偏相关系数来查看:
还以上面的序列为例:用eviews得到自相关和偏相关图,Q统计量和伴随概率。
分析:平稳的序列的自相关图和偏相关图不是拖尾就是截尾。截尾就是在某阶之后,系数都为 0 ,怎么理解呢,看上面偏相关的图,当阶数为 1 的时候,系数值还是很大, 0.914. 二阶长的时候突然就变成了 0.050. 后面的值都很小,认为是趋于 0 ,这种状况就是截尾。再就是拖尾,拖尾就是有一个衰减的趋势,但是不都为 0 。
自相关图既不是拖尾也不是截尾。以上的图的自相关是一个三角对称的形式,这种趋势是单调趋势的典型图形。
下面是通过自相关的其他功能
如果自相关是拖尾,偏相关截尾,则用 AR 算法
如果自相关截尾,偏相关拖尾,则用 MA 算法
如果自相关和偏相关都是拖尾,则用 ARMA 算法, ARIMA 是 ARMA 算法的扩展版,用法类似 。
一定有同学要问了:楼主检测出来不是平稳的怎么办啊?(楼主:当然要把它整平稳啦~~)
如果遇到数据检测出来不平稳,可以考虑使用差分这个最常用的办法(当然,还有好多种其他方法处理)
还是上面那个序列,两种方法都证明他是不靠谱的,不平稳的。确定不平稳后,依次进行1阶、2阶、3阶...差分,直到平稳位置。先来个一阶差分:
从图上看,一阶差分的效果不错,看着是平稳的。
(看着是平稳的又怎样,要确切知道是否是平稳的,还需要其他的检验,且听楼主下回讲解~~)