主题:对某大型医院每月住院情况的时间序列分析
数据来源:从住院表中抽取从08年1月到12年11月之间住院病人数据
抽取好后的数据如下
接着做时间序列分析
首先要绘制图形
data sas_test;input x @@;n=_n_;cards;3823 29024026 4165 4060 3909 4233 4224 4333 3955 4006 45763549 36384586 4517 4146 4542 4644 4394 4480 3895 4265 46004124 34615262 5242 5191 5174 5558 5518 5374 4628 5390 54084960 35795757 5469 5983 5729 5762 6176 5894 5609 5984 65174952 60436690 6587 6803 6452 7005 7064 6776 6239 6843;proc gplot data=sas_test;symbol i=splinev=star h=2 c=green;plot x*n;run;
结果如下
可以看出该图形还是很有规律的,但似乎不怎么满足均值恒定的条件
确定模型,代码如下proc arima data=sas_test;identify var=xnlag=12;run;结果如下
自相关系数显然是拖尾的
偏相关系数可以认为在2处截尾,也可以认为是拖尾的查表可得:自相关函数拖尾,偏相关函数截尾则使用AR(2)模型 自相关函数拖尾,偏相关函数拖尾则使用arma模型首先进行AR(2)模型的分析,
代码如下estimate p=2结果如下
可以看到该模型通过了检验
对于arma模型,需要确定p q,这个在课上没有讲,本人查阅了大量资料,依然不得其解,只好放弃了事。
查看结果,最终模型如下