全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
24727 13
2015-07-01
有几个关于logistic回归的问题请教各位大神:
1.自变量是连续变量时,将其用四分位数法分为四个水平,以第一水平为参照设哑变量,可以得到其余三水平相对于第一水平的OR值,请问该自变量的P for trend 该如何在SPSS中计算?我曾见有人将该自变量的四水平作为连续变量进入方程,所得P值即为P for trend,这样是正确的吗?
2.P for trend 在文献中每每提及,它的具体意义究竟是什么?研究中往往希望最高水平相对于最低水平,P值小于0.05,如果上述情况满足,但是此时P for trend大于0.05,该如何解释该结果?反过来,如果P for trend小于0.05,但各水平对于最低水平的P值却大于0.05,又该如何解释该结果?
3.在SPSS中,如以上述方式处理连续自变量,在最后结果中可以看到其余三水平相对于第一水平的OR值和P值,在这些结果上面一行,还有一个P值,请问该P值的含义究竟是什么,如图中红圈所示:




4.自变量是连续变量时,文献中常见per SD change的说法,即自变量改变一个标准差,请问如何在SPSS中得到自变量改变一个标准差的OR值?如果将自变量作为连续变量直接进入方程只能得到改变一个单位,而不是一个标准差的OR值。
被这些问题困扰已久,恳请各位解答!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-7-1 10:54:19
第一个问题:类别变量在构建回归(包括logistic回归)模型时,是要以哑变量的方式进入模型的,因为类别变量的编码是无意义的,不能进行加减乘除的(如有4个类别,编码为1,2,3,4和编码为10,20,30,40一样)。所以直接将多类别变量纳入模型是不正确的(二分类类别变量可以直接纳入模型);第二个问题,涉及到类别变量关注组和参照组间的比较和解释问题。楼主这个问题三言两语说不清楚。建议找相关文献看看如何解释类别变量对因变量的影响。同时,推荐谢宇老师《回归分析》一书(论坛有电子版),看看Logit回归这章,对Logit模型结果的解释有好几种(如OR,边际效应等)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-7-1 10:56:50
xddlovejiao1314 发表于 2015-7-1 10:54
第一个问题:类别变量在构建回归(包括logistic回归)模型时,是要以哑变量的方式进入模型的,因为类别变量 ...
好东西,多谢推荐了一本好书。高手真猛啊。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-7-1 10:57:18
第三个问题在我看来这个表格的模型构建方式是有问题的,做的人没有将类别变量处理为哑变量纳入模型,而是直接将多类别变量纳入模型,所以才会出现既有多类别变量的估计,又有哑变量的估计。我个人觉得正确的做法是利用recode命令将多类别变量处理为哑变量,然后直接将哑变量纳入模型建模,就只会得到关注组相对于参照组的结果。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-7-1 11:00:18
最后一个问题,我看到的这么多的关于Logistic模型的书或者文献,还没有见过用自变量标准差变化去解释因变量变化的(多元线性回归里有)。对于logistic模型而言,我个人觉得大家可能更关注OR(比数比)或者边际效应的变化,对标准差的变化关注可能较少。毕竟logistic模型是一个概率变化模型。祝好运。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-7-1 11:01:13
学术新人—加油 发表于 2015-7-1 10:56
好东西,多谢推荐了一本好书。高手真猛啊。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群