请问线性mixed模型中,random effect的自由度应该如何计算?
比如下面程序生成一个简单的数据集,总共10个人,分为两组,每组5人,两组的平均数有差别,正态模型
data d1;
do i=1 to 10;
group=int((i-0.000001)/5);
y=group+rannor(0);
output;
end;
run;
用PROC MIXED分析,
PROC MIXED DATA=d1;
CLASS group i;
MODEL y=group /noint s;
RANDOM INTERCEPT /s SUB=i;
run;
得到以下结果:
Type 3 Tests of Fixed Effects
Num Den
Effect DF DF F Value Pr > F
group 2 0 1.69
F检验的分母自由度为0,我理解这是因为RANDOM INTERCEPT/s SUB=i 这句为每个人都估计一个intercept,所以把自由度用光了。但是不太理解为什么会这样?
设这些intercept服从N(0,sigma)的分布,在fit model的时候, 应该是只有sigma被带入运算,也就是说,虽然intercept有10项之多, 但是实际上只贡献了一个参数而已。 一旦这个参数sigma定下来,具体每个人的intercept可以根据公式用sigma和y算出来。 那么为什么这些intercept会占用这么多的自由度呢?而不是只占一个自由度而已?
是我什么地方理解的不对么?请高手指教。