第一节 时间序列分析的一般问题
一、 时间序列的含义
时间序列是指被观察到的以时间为序排列的数据序列。
时间序列可以通过表格或图形的形式表现出来。例如:
二、时间序列的特征
观测值有序排列,且前后观测值之间有一定的相关性。
二、时间序列分析的目的:
1、 建模—弄清楚数据序列的结构和生成机制。
2、 预测—外推预测未来值。
3、 控制—实现最优控制。
三、时间序列的主要分类:
1、 按年研究的对象的多少分,有一元时间序列和多元时间序列。
2、 按时间的连续性可将时间序列分为离散时间序列和连续时间序列两种。
3、 按序列的统计特性分,有平稳时间序列和非平衡时间序列两类。
4、 按序列的分布规律来分,有高斯型时间序列和非高斯型时间序列。
第二节 时间序列的建立
我们把获取时间序列以及对其进行检查、整理和预处理等工作,称为时间序列的建立。
一、 时间序列数据的采集
对于所研究系统来说,相应于时间的连续性,系统在不同的时刻上的响应常常是时间t的连续函数。为了数字计算处理上的方便,往往只按照一定的时间间隔对所研究系统的响应进行记录和观察,我们称之为采样。相应地把记录和观察时间间隔称为采样间隔。
通常采样采用等间隔采样。
二、 离群点(Outlier)的检验与处理
离群点(Outlier)是指一个时间序列中,远离序列一般水平的极端大值和极端小值。对时间序列离群点分析的方法,有时也被称作稳健估计(Robust Estimation),该方法最早由Box和Anderson于1955年提出。
1、 离群点(Outlier)产生的原因:
(1)采样误差;
(2)系统各种偶然非正常因素影响。
2、 离群点的数理描述:
(1)它们是既定分布中的极端点(exteme point),它们虽与数据主体来自同一分布,但本身应以极小的概率出现。
(2)这种点与数据集的主体并非采自同一分布,而是在采集数据过程中受到其他分布的“污染”,致使现有数据集掺入不应有的“杂质”。
3、 离群点(Outlier)的类型:
(1)加性离群点(Additive Outlier),造成这种离群点的干扰,只影响该干扰发生的那一个时刻T上的序列值,而不影响该时刻以后的序列值。
(2)更新离群点(Innovational Outlier),造成离群点的干扰不仅作用于XT,而且影响T时刻以后序列的所有观察值。
(3)水平移位离群点(Level Shift Outlier),造成这种离群点的干扰是在某一时刻T,系统的结构发生了变化,并持续影响T时刻以后的所有行为,在数列上往往表现出T时刻前后的序列均值发生水平位移。
(4)暂时变更离群点(TemporaryChange Outlier),造成这种离群点的干扰是在T时刻干扰发生时具有一定初始效应,以后随时间根据衰减因子的大小呈指数衰减。
从下向上:原始序列、AO列、TCO列、IO列和LSO列,离群干扰发生在T=50
四种不同的离群点的对比图
4、 离群点(Outlier)的处理方法:
(1)直接进行剔除;
(2)对数据模型进行修正处理分析。
三、 缺损值(Missingvalue)的补足
依据系统运动轨迹或变化趋势,运用一定的方法对缺损值进行估计、推测,以补足缺损的数值。
第三节 确定性时序分析方法概述
一个时间序列往往是以下几类变化形式的叠加或耦合:
(1) 长期趋势变动(T)。它是指时间序列朝着一定的方向持续上升或下降,或停留在某一水平上的倾向,它反映了客观事物的主要变化趋势。
(2) 季节变动(S)。即指一年或更短的时间之内,由于受某种固定周期性因素(如自然、生产、消费等季节性因素)的影响而呈现出有规律的周期性波动。
循环变动(C)。通常是指周期为一年以上,由非季节因素引起的涨落起伏波形相似