进行Logistic回归时(实际Cox回归同样存在类似问题)SPSS中可以用categorical...来定义分类协变量(哑变量),那么问题就来了,何时定义哑变量,对于二分类变量或三分类变量何时应该做为哑变量处理。因为做不做为哑变量处理结果完全不同。
下面举个例子,大家来看看:
举例数据库见附件:rar解压后即可
不同方法结果不同见附件word文档
筛选变量采用Foward:Wald
如果设置哑变量,则哑变量对照方法采用系统默认的indicator
针对术后是否复发做logistic回归分析
三种方法,结果不同
方法1、所有变量均不做为哑变量,直接分析,结果如下
方法2、将变量除年龄外的胃切除、家族遗传、营养状况、术后化疗均做为哑变量进行分析,结果如下
方法3、仅将三分类变量胃切除、营养状况做为哑变量分析,二分类变量家族遗传、术后化疗不做为哑变量分析,结果如下
请问各位仁兄和老师,为什么三个结果会不同,我们应该选择哪种方法。该例数据实际来源于统计书《医学统计学与SPSS 软件应用》例13-1,书中采用的是第一种方法,为什么用第一种方法?书中的举例有问题?