一直没弄清楚二分类的多水平模型和logistic回归中把更高水平变量设成普通的哑变量到底有什么区别啊?非常想请教下,希望各位指点一下!
多水平模型中更高水平的变量的效应到底是怎么估计的,气基本思想是类似logistic回归里面设成哑变量吗?如果是设成哑变量,那它在多水平模型中到底占不占用自由度?都说多水平模型考虑了组内相关性,到底它是通过怎样一个计算过程来考虑的?组内相关性怎么表现的?如果有这种组内相关性,假设1水平为个体,2水平为30所学校,这个组内相关性又说明的是什么呢?是一个学校内部个体的相关性?还是总体的?如果是总体的,30家单位之间的变异它是怎么考虑的?
开发多水平模型的基本思想是将高水平的变异分解出来,但是它们到底在模型是怎么表现的?在我看来最简单的二分类的多水平模型的表现形式与普通的logistic回归的表现形式的区别就是把普通的logistic回归的常数项分解为两部分,解释上就是把原始的除自变量之外不能解释的因变量的变异分解为高水平之间的变异和除自变量之外不能解释的因变量的变异。但是实际上这跟在logistic回归里面将高水平变量设成哑变量有什么区别呢?因为实际上,同样都是相当于增加了一部分高水平变量之间的变异对因变量的解释程度大小
非常欢迎指点!^_^