全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
8371 5
2011-12-27
请问SPSS中做logistic回归,自变量如果是多于两类的分类变量,一定要将其先设置成虚拟变量吗,请哪位前辈告知一下?非常感谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-12-27 21:29:53
自己顶
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-12-28 05:12:15
是的,需要设置为虚拟变量. 不然其结果无法解释.  比如, 结果变量为是否发生肺癌, 假定为多个自变量的回归模型, 其中一个自变量为民族(汉族,回族,朝鲜族, 等),其赋值为1, 2, 3, 4, 等. 若设置为虚拟变量(选择汉族为对照组), 其流行病学意义可以解释为, 回族和汉族相比废癌的发生增加/或减少多少倍, 朝鲜族和汉族相比肺癌的发生增加/减少多少倍, 等.

设置为虚拟变量和不设置为虚拟变量最大的不同是: 前者估计出多个回归系数和OR值,而后者只有一个. 我建议,对于多个分类变量要虚拟变量. 当然,如果是有列的多分类(比如学生的年级, 或年龄组等), 也可以不设置虚拟变量. 但其意义解释不全面.

高兴的是,现在的软件, 包括SPSS, SAS 等, 都有选择项,可以很容易在配合logistic回归模型时设置虚拟变量,得到其参数估计值.

希望以上的解释对你有帮助.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-1-13 16:55:45
上面的解释非常好,我补充点,对于自变量多于两类的分类变量要根据研究的实际情况,能否当成连续变量来进行研究,特别是对于有序分类变量时,如果分类间的效应同步作用时,可当成连续变量来进行统计,否则就设置虚拟变量来进行统计研究了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-1-13 23:34:41
谢谢ls两位的解释,非常感谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-10-14 10:13:51
在此也想请问大家一下,我在SPSS里做逻辑回归时,由于之前做线性回归时已经将所需要用到的分类变量转换成了虚拟变量,那么在做逻辑回归时,是否就可以把这些虚拟变量直接纳入到“协变量”处理,而不用将原始变量再纳入“因子”或“分类”,让系统再另外转换成虚拟变量了?因为系统转换的虚拟变量的参照点(第一或最后一个)不是我想要的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群