全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
9198 1
2012-12-30

被解释变量y是二元变量,取值为1或0。用logistic回归,被解释变量为X1、X2---X6都是分类变量。只有X1一个参与回归时,其系数a为正(如果是e的a次方,则大于1)。但是当加了其他变量X3---X6,X1系数a变负。如果Y表示是否得某种病,X1表示性别,以女性为参照组,X1系数为正,表明男性得病几率高于女性。但是当加了其他变量后,X1系数由正变负,就意味着男性得病几率低于女性。结论就反了。而且都很显著。如何解释?
描述性统计发现男性患病率比女性高。只有X1时结论与描述性一致,但是加了其他变量后,结论与描述性就不一致了。我觉得系数大小改变可以说控制住其他变量了,但是系数符号 改变仅仅说“控制住其他变量”理由似乎不太充分。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-12-30 09:45:19
很正常,加入其他的变量,其实相当于控制了其他的因素,性别由危险因素变成保护因素很正常
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群