全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
32450 26
2013-07-30
进行Logistic回归时(实际Cox回归同样存在类似问题)SPSS中可以用categorical...来定义分类协变量(哑变量),那么问题就来了,何时定义哑变量,对于二分类变量或三分类变量何时应该做为哑变量处理。因为做不做为哑变量处理结果完全不同。
下面举个例子,大家来看看:
举例数据库见附件:rar解压后即可
logistic例.rar
大小:(920 Bytes)

 马上下载

本附件包括:

  • logistic例.sav


不同方法结果不同见附件word文档

筛选变量采用Foward:Wald
如果设置哑变量,则哑变量对照方法采用系统默认的indicator
针对术后是否复发做logistic回归分析

三种方法,结果不同
方法1、所有变量均不做为哑变量,直接分析,结果如下
p1.png
方法2、将变量除年龄外的胃切除、家族遗传、营养状况、术后化疗均做为哑变量进行分析,结果如下
p2.png
方法3、仅将三分类变量胃切除、营养状况做为哑变量分析,二分类变量家族遗传、术后化疗不做为哑变量分析,结果如下
p3.png
请问各位仁兄和老师,为什么三个结果会不同,我们应该选择哪种方法。该例数据实际来源于统计书《医学统计学与SPSS 软件应用》例13-1,书中采用的是第一种方法,为什么用第一种方法?书中的举例有问题?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-7-31 00:01:52
纠正你一下。方法2和3的结果是一样的。只是家族遗传、术后化疗系数的正负号不一样,这说明spss和你选择了不同的状况做为对照组。但实质上是一样的。
方法1和其他两种方法不一样是很正常的呀,完全就是不同的回归模型。方法1是把三分类变量当作一个变量处理,而方法2和方法3是spss把三分类变量自动分为两个虚拟变量后,才进行的回归。
我也是初学者,回答的不知道对不对,见笑了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-7-31 00:09:06
ofzhengyi 发表于 2013-7-31 00:01
纠正你一下。方法2和3的结果是一样的。只是家族遗传、术后化疗系数的正负号不一样,这说明spss和你选择了不 ...
谢谢回答啊,后两个结果是一样的,也就是说如果是二分类变量无论如论是否当哑变量进行分析,结果都是相同的。非常感谢,我明白了。
但书中没有将三分类变量当虚拟变量处理是否是错误的?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-7-31 00:18:57
ofzhengyi 发表于 2013-7-31 00:01
纠正你一下。方法2和3的结果是一样的。只是家族遗传、术后化疗系数的正负号不一样,这说明spss和你选择了不 ...
谢谢啊,细细想想,您说的有道理啊。二分类变量确实无论是否当哑变量处理结果都是一样的,高手就是高手。

另外一个问题不讨论了,我想教材中可能只是考虑数据的处理,而会忽略一些数据处理的合理性吧,我可能太钻牛角尖了。非常感谢您。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-7-31 00:27:12
你这边的三分类变量其实是定序变量,按书本上那样子处理也是可以的。定序变量按照方法1的处理方法可以节约自由度,即用方法1比方法2可以少估计一个系数。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-7-31 07:50:35
ofzhengyi 发表于 2013-7-31 00:27
你这边的三分类变量其实是定序变量,按书本上那样子处理也是可以的。定序变量按照方法1的处理方法可以节约自 ...
谢谢,嗯,你说的有道理,营养状态确实可以当定序变量,但胃切除的方式有点牵强
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群