有一个疑问纠结了很久,高水平变量在多水平变量里面到底占不占用自由度?自由度该如何确定?
与这个问题相对的另一个问题是,我们通常会对多水平模型有如下的理解:如果在普通的logistic回归里面将高水平变量设成哑变量(也即采用固定效应),它与多水平模型中将高水平变量的变异设成随机效应的区别在于:虽然估计值不会有太大改变,但是P值会有很大差别,原因是固定效应模型不能估计正确的方差成份,所以估计值的标准误也都是错的。最终导致P值有很大区别。
结合标题中的问题,我对“估计值可能没有多大差别,但是P值会差别很大”的理解是:如果高水平变量在多水平模型中不占用自由度,那引起P值差异的主要原因应该就是自由度的改变。不占用自由度的原因也正是跟假定变异服从随机分布有关,是否将变异设置成随机效应模式的变量都不占自由度,不知道理解是否正确,望各位讨论。非常感谢,^_^
如果占用自由度,但是自由度的计算不像logistic回归里面的自由度确定方法,希望能继续探讨?非常感谢!