全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
4488 5
2009-08-15
在logistic regression 遇到一个问题 一直想不明白
想请教下 高手: 我得模型中dependent variable 是 0 1 形式的, independent variables 全都设成0,1形式,共有176个dummy variables
我用的是stepwise logistic regression 作的,  但是运行结果在第一步  intercept residual chi square test 那说df 是133
我不明白为什么得到的是 133? 怎么运算这个degree of freedom 和  chi square test ? 谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2009-8-15 03:05:13
I guess when you set the dummy variables, some of them are dupicate. For example, if variable A has 4 values, you only need 3 dummy variables for it.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-8-15 03:44:30
2# kunkunred

how many data(observation) do you have?
你可以把运行的model信息贴出来嘛
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-8-15 05:08:37
数据大概 11万左右  变量40 个  我都设成 dummy variable 形式的  结果太大 不太好发
2楼说的意思我有点不明白,  1个variable 有四个值 为什么不能设成4个dummy 呢?
我是这样设的  if A=1 then A_1=1  else  A_1=0; if A=2 then A_2=1  else  A_2=0;
if A=3 then A_3=1  else  A_3=0; if A=4 then A_4=1  else  A_4=0;
设3个dummy 是不是为了在odd ratio 那有个比较?  可是我的变量太多 应该odd ratio 比较有意义吗?
这样设有什么不好的吗? 谢谢楼上2位朋友
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-8-15 05:20:34
Response Profile

                                Ordered                      Total
                                  Value     CANCELTY     Frequency

                                      1     1                 9619
                                      2     0                86716

                              Probability modeled is CANCELTY='1'.


                                  Stepwise Selection Procedure


Step  0. Intercept entered:


                                    Model Convergence Status

                         Convergence criterion (GCONV=1E-8) satisfied.

                                      -2 Log L = 62569.993


                                    Residual Chi-Square Test

                               Chi-Square       DF     Pr > ChiSq

                                2679.8100      133         <.0001


只贴这么多  后面的太多了 呵呵 谢谢了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-8-15 06:23:52
5# guangqing

有些不解为什么需要设定dummy变量,如果放入class,不等效吗?

176-40=136. 应该是136?3个不同是不是因为某些量是定值(df=0)或者一些变量完全相同?
另外,如果A有3个level,那么设定3个和2个dummy没有什么不同。在数自由度是会减掉额外的个数。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群