累积logit模型的建模过程有点特别,看一下formula:是3个取值的因变量对应的概率p1、p2、p3
等号左边计算的是累积概率,右边的回归截距是不同的,但所有的自变量及其系数都是相同的,下面是计算概率的公式。
下面是SAS中经常使用的语句:
说明:1)predicted:计算Pr(Y<=_LEVEL_)的概率,从而可以得到p1、p2、p3的概率。
2)dist=multinomial和link=cumlogit指定分布形式和连接函数,这个固定的,不需要改;
3)aggregate:报告数据的离散(或集中)信息,广义线性模型均需要提供数据离散信息(devience/df是否等于1),如果有问题可以通过scale调整,也可以贝叶斯的方法处理。
SAS logistic语句也可以实现这种方法,不过genmod使用的更频繁。
可以看出该模型对数据有很严格的要求(系数不变,截距在变),经常在使用这种模型的时候,也会将这种分类视为无序分类从而使用其他模型处理。例如无序logistic模型等。