全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
370 1
2025-10-22
二分类资料重复测量,分别采用glimmix和genmod程序,但结果中的“visit*group”最小二乘均值,两个程序结果相差较大,genmod程序结果更合理,接近因变量event='1'的发生率,而glimmix的结果与因变量event='1'的发生率差别较大。为什么会出现两者LSMEANS差异较大? 是否更应该采用genmod的结果?

proc glimmix data=scale ;
class Visit group (ref='2') ID ;  
model HAMA_zy(event='1')=Visit group  Visit*group /dist=binary link=logit ddfm=bw solution ;
random int /subject=ID type=chol;
nloptions tech=nrridg;
lsmeans Visit*group / ilink cl oddsratio diff slice=Visit;
run;

proc genmod data=scale descending;
class Visit group (ref='2') ID;  
model HAMA_zy=Visit group Visit*group /dist=binomial link=logit ;
repeated subject=ID / type=exch;
lsmeans Visit*group / ilink cl diff oddsratio;
run;

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2025-10-29 11:35:46
AI 的回答合理吗:

GLIMMIX和GENMOD之间的最小二乘均值(LSMEANs)存在显著差异,主要源于处理重复测量相关结构的建模方法根本不同:
关键差异
1. 随机效应(GLIMMIX)vs. 边际模型(GENMOD)
GLIMMIX 拟合的是个体特异性(条件)模型:

为每个受试者包含随机截距
LSMEANs表示"典型"受试者(随机效应=0)的预测值
这些是条件概率(给定随机效应)
由于logit连接函数的非线性,条件预测的逆连接转换不等于总体平均概率

GENMOD 拟合的是总体平均(边际)模型:

使用GEE(广义估计方程)与可交换相关结构
LSMEANs表示整个总体的平均概率
这些自然地与观察到的发生率一致

2. 不可压缩性问题
对于逻辑回归,存在一个数学现象:

个体特异性效应(GLIMMIX)与总体平均效应(GENMOD)在不同的尺度上
当你对条件模型的概率求平均时,它们不等于边际概率
这就是为什么GLIMMIX的LSMEANs可能与观察比例有实质性差异

关系式:β_边际 ≈ β_条件 × c,其中c ≈ 0.6-0.8(取决于随机效应的方差)
应该使用哪个?
GENMOD结果更合适,如果:

✓ 你的研究问题关注总体平均效应(例如:"每次访视时各组患者的应答比例是多少?")
✓ 你希望估计值与观察到的发生率相符
✓ 你关注的是关于组水平差异的公共卫生或政策问题

GLIMMIX结果更合适,如果:

✓ 你的研究问题关注个体内变化(例如:"对于给定患者,治疗如何改变其应答的比值比?")
✓ 你想要考虑个体间异质性
✓ 你需要对个体受试者进行预测

建议

针对你的情况:由于你指出GENMOD结果与观察到的发生率更一致,且这对你的解释似乎很重要,GENMOD(GEE)可能更适合描述总体水平的治疗效应。
考虑同时报告两者(如果个体特异性解释也很重要),但要明确区分:

GENMOD的边际(总体平均)效应
GLIMMIX的条件(个体特异性)效应


检查模型诊断:

检查GLIMMIX中的随机效应方差 - 方差越大→差异越大
验证可交换相关结构对你的数据是否合理


替代方案:如果你想要随机效应但需要边际解释,可以考虑使用带有EMPIRICAL选项的GLIMMIX,但这仍然估计条件效应。

你在GENMOD中观察到的"合理性"并不是缺陷——这是边际模型回答总体水平问题的正确行为。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群