被解释变量y是二元变量,取值为1或0。用logistic回归,被解释变量为X1、X2---X6都是分类变量。只有X1一个参与回归时,其系数a为正(如果是e的a次方,则大于1)。但是当加了其他变量X3---X6,X1系数a变负。如果Y表示是否得某种病,X1表示性别,以女性为参照组,X1系数为正,表明男性得病几率高于女性。但是当加了其他变量后,X1系数由正变负,就意味着男性得病几率低于女性。结论就反了。而且都很显著。如何解释?
描述性统计发现男性患病率比女性高。只有X1时结论与描述性一致,但是加了其他变量后,结论与描述性就不一致了。我觉得系数大小改变可以说控制住其他变量了,但是系数符号 改变仅仅说“控制住其他变量”理由似乎不太充分。