全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
3923 1
2008-12-06

试验有三种结果(响应变量),分别为1,2,3,nop;fac, ant为协变量,n为该种结果出现的次数,模型为:

log[P(y=1)/P(y=3)]=b1+X'b2

log[P(y=2)/P(y=3)]=b3+X'b4

其中b2和b4为分别由nop,fac 和ant的参数构成的向量,数据及sas程序如下:

data oo;                

         input y nop fac ant n; 

         datalines;                 

3     0     1     1     17   

1     0     1     1     0    

2     0     1     1     1    

3     0     0     1     2    

1     0     0     1     0    

2     0     0     1     0    

3     0     1     0     30   

1     0     1     0     11   

2     0     1     0     17   

3     0     0     0     32   

1     0     0     0     4    

2     0     0     0     4    

3     1     1     1     87   

1     1     1     1     4    

2     1     1     1     7    

3     1     1     0     3    

1     1     1     0     10   

2     1     1     0     13   

3     1     0     0     9    

1     1     0     0     0    

2     1     0     0     0    

       ;          

      run;

  proc genmod data=oo;   

     model y = nop fac ant / dist=multinomial

                            link=cumlogit;

      WEIGHT n;

run;

                                      Analysis Of Parameter Estimates

 

                                            Standard     Wald 95% Confidence       Chi-

            Parameter     DF    Estimate       Error           Limits            Square    Pr > ChiSq

 

            Intercept1     1     -3.2046      0.4537     -4.0938     -2.3154      49.89        <.0001

            Intercept2     1     -1.7920      0.4033     -2.5825     -1.0015      19.74        <.0001

            nop            1      0.8529      0.3610      0.1454      1.5604       5.58        0.0181

            fac            1      1.8902      0.4449      1.0182      2.7623      18.05        <.0001

            ant            1     -3.0031      0.4302     -3.8462     -2.1600      48.73        <.0001

                     Scale          0      1.0000      0.0000      1.0000      1.0000

估得的结果没有分b2和b4,而是视为一个b,如何把他们分开估呢?非常感谢!

结果应该是:b1=-2.621 b2nop=1.174 b2ant=-3.52 b2fac=1.829; b3=-2.560 b4nop=0.996 b4ant=-3.087 b4fac=2.195

这是98年版《Multivariate Statistical Modelling Based on Generalized Linear Models》第67页的一道例题,研究了半天没搞出来,还望指点,小弟在此先谢了

还有个问题是关于模型的拟合(如下),通过调整scale,Scaled Deviance可以变小,但Deviance还是很大(Pearson同),这是否仍说明模型不理想(应该看哪个?),谢谢!


                                     Criteria For Assessing Goodness Of Fit

                          Criterion                 DF           Value        Value/DF

                          Deviance                   8        226.5177         28.3147
                          Scaled Deviance            8          1.0067          0.1258
                          Pearson Chi-Square         8        257.2508         32.1563
                          Scaled Pearson X2          8          1.1433          0.1429
                          Log Likelihood                       -0.5034

[此贴子已经被作者于2008-12-6 19:31:18编辑过]

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2009-4-15 19:27:00

你没有分清属性变量中的nominal和ordinal两种类型,既然你想得到:

log[P(y=1)/P(y=3)]=b1+X'b2

log[P(y=2)/P(y=3)]=b3+X'b4

这说明你的属性变量是nominal类型的,所以link函数不应该用累计分布函数,而应该用分类分布函数:link=glogit.试一试看!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群