全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
2864 6
2017-05-16
同一个logit模型,把连续变量变成等级变量后,原来有意义的变量变得没意义了...为什么会这样?(如下)

此时年龄为连续变量

Logistic regression                               Number of obs   =        853
                                                  LR chi2(25)     =     478.20
                                                  Prob > chi2     =     0.0000
Log likelihood = -327.76383                       Pseudo R2       =     0.4218

------------------------------------------------------------------------------
             y | Odds Ratio     Std. Err.       z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
01         age |   1.019423   .0096232     2.04   0.042     1.000735     1.03846
02         sex |   .7722022   .1662755    -1.20   0.230     .5063431    1.177652
03         bmi |    .720419   .3173294    -0.74   0.457     .3038427    1.708132

把age每隔10年一变后,(即2=20-39岁,3=30-39岁...)

Logistic regression                               Number of obs   =        853
                                                  LR chi2(25)     =     477.11
                                                  Prob > chi2     =     0.0000
Log likelihood =  -328.3091                       Pseudo R2       =     0.4208

------------------------------------------------------------------------------
           y | Odds Ratio   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      ageage |   1.175588   .1084009     1.75   0.079      .981219     1.40846
         sex |   .7662321   .1648721    -1.24   0.216     .5025799    1.168196
         bmi |   .7220615   .3180196    -0.74   0.460      .304563    1.711872


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-5-16 15:31:14
连续性变量换成类别变量后,在0.1水平上显著的。我的疑问是为什么连续的变量要人为的分组呢?同时,分组以你10年为段分组,其意义何在呢?如果你以老中青这种方式分组还说的过去。个人不是太建议将连续性变量降低“信息”变为类别变量。祝好运~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-5-16 16:35:53
xddlovejiao1314 发表于 2017-5-16 15:31
连续性变量换成类别变量后,在0.1水平上显著的。我的疑问是为什么连续的变量要人为的分组呢?同时,分组以你 ...
谢谢xddlovejiao1314老师的回复。

因为之前我问:“”请问各位老师,Logistic regression 时,Odds Ratio  趋近于1,几乎没应用意义 1.01737 , 但p值远<0.05(如下红色标注项),这种情况,建模时需要排除还是保留这个变量??如果保留的话相对风险增加 1.01737几乎没意义 啊。。。。怎么解决??“”

然后有老师建议我改变单位。。。

我还有其他变量也尝试过改成等级,但唯独age这个变量的显著性改变了。。。

难道,这说明,有一段年龄在模型中很重要?但信息被我隐藏在了10年的区间里??

亦或有什么别的解释吗??谢谢老师!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-5-16 16:38:27
alasaa 发表于 2017-5-16 16:35
谢谢xddlovejiao1314老师的回复。

因为之前我问:“”请问各位老师,Logistic regression 时,Odds Ra ...
这个变量的显著性改变看怎么看,如果以0.1为标准,还是显著的。还是回到上面那个问题,连续性变量所包含的信息比类别变量更多,一般不轻易降级;同时,连续性的age变量改为类别变量,为何要以10为段呢。用老中青这种不是更好么?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-5-16 16:57:31
xddlovejiao1314 发表于 2017-5-16 16:38
这个变量的显著性改变看怎么看,如果以0.1为标准,还是显著的。还是回到上面那个问题,连续性变量所包含的 ...
谢谢老师!
改成老中青确实更好去讨论,但p值就更大了,快趋近于1了。。。我是考虑到“年龄每长一岁,OR相对增加那么点,放入现实生活实在是没意义”,所以才想改成等级

但现在结果如此,我困惑于:年龄这个变量,最终,还要不要放入模型??
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-5-16 17:01:33
alasaa 发表于 2017-5-16 16:57
谢谢老师!
改成老中青确实更好去讨论,但p值就更大了,快趋近于1了。。。我是考虑到“年龄每长一岁,OR ...
连续性变量你得到的结果解释:年龄增加1岁,OR变化没太大现实意义。但你为啥解释时不考虑,直接连续性增加10岁呢,这样讨论就有意义了呗。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群