本科毕业论文想做一个关于PM10和每日入院人数的时间序列分析,用的是GAM模型,但在选取模型样条函数的自由度上无从下手,还有控制时间的变量如何加入模型语句中?
下面为初步的程序语句,其中输入的变量分别为:时间(1~730),控制周日效应的哑元变量(1~7),总人数n,心血管病人数n1,呼吸系统病人数n2,pm10污染物浓度,so2浓度,no2浓度,温度,湿度。
data a;
input time dow n n1 n2 pm10 so2 no2 t rh;
logn1=log(n1);
cards;
1 4 25 7 18 .106 .90 .72 3.5 33.00
2 5 33 14 19 .078 .18 .68 4.0 38.00
3 6 25 9 16 .126 .98 .80 4.8 50.00
4 7 34 8 26 .134 .70 .68 3.4 78.00
5 1 33 10 23 .142 .84 .68 3.5 76.00
6 2 20 9 11 .110 .64 .51 1.0 96.00
7 3 19 5 14 .116 .52 .51 2.6 88.00
8 4 27 11 16 .116 .78 .59 4.5 79.00
.
.
.
729 4 1 1 0 .162 .74 .54 3.6 32.00
730 5 0 0 0 .102 .54 .50 1.0 30.00
;
proc gam;
model logn1=param(pm10)spline(time)spline(t)spline(rh)/dist=poisson;
score data=a;
run;