全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学
2873 4
2010-02-22
希望bobguy和jingju11等高手相助!
问题是这样的:A retailer of hand-held organizers wants to relate the ownership of the devices with annual income of the purchaser. Data is collected on 20 people and can be found in the file
Palmorg.xls
大小:(13.5 KB)

 马上下载

. The data includes ownership of a handheld is indicated by y=1 and purchaser annual income x.

如果我不将收入分类,直接run出来的结果是income的相关性不高的,但是我又不知该如何分类。我试过按收入区间20000-30000,30000-40000这样分类,但结果还是不行。的确同样量太小了,但如果非要计算,该如何呢?在此求助了!!谢谢!!

The LOGISTIC Procedure

                                        Model Information

                   Data Set                      _PROJ_.PALMORG               
                   Response Variable             Ownership            Ownership
                   Number of Response Levels     2                             
                   Number of Observations        20                           
                   Model                         binary logit                  
                   Optimization Technique        Fisher's scoring              


                                         Response Profile
  
                                Ordered                       Total
                                  Value     Ownership     Frequency

                                      1            1              7
                                      2            0             13

                               Probability modeled is Ownership=1.


                                     Model Convergence Status

                          Convergence criterion (GCONV=1E-8) satisfied.         


                                       Model Fit Statistics
  
                                                           Intercept
                                            Intercept            and
                              Criterion          Only     Covariates

                              AIC              27.898         29.193
                              SC               28.894         31.184
                              -2 Log L         25.898         25.193


                             Testing Global Null Hypothesis: BETA=0
  
                     Test                 Chi-Square       DF     Pr > ChiSq

                     Likelihood Ratio         0.7051        1         0.4011
                     Score                    0.7045        1         0.4013
                     Wald                     0.6778        1         0.4104


                            Analysis of Maximum Likelihood Estimates
  
                                              Standard          Wald
               Parameter    DF    Estimate       Error    Chi-Square    Pr > ChiSq

               Intercept     1     -1.6008      1.3041        1.5068        0.2196
               income        1    0.000022    0.000027        0.6778        0.4104
1                                                           17:47 Saturday, February 15, 2003   2

                                      The LOGISTIC Procedure

                                       Odds Ratio Estimates
                                                
                                         Point          95% Wald
                            Effect    Estimate      Confidence Limits

                            income       1.000       1.000       1.000


                  Association of Predicted Probabilities and Observed Responses

                        Percent Concordant     70.3    Somers' D    0.418
                        Percent Discordant     28.6    Gamma        0.422
                        Percent Tied            1.1    Tau-a        0.200
                        Pairs                    91    c            0.709
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-2-23 08:38:41
frankling 发表于 2010-2-22 13:11
希望bobguy和jingju11等高手相助!
问题是这样的:A retailer of hand-held organizers wants to relate the ownership of the devices with annual income of the purchaser. Data is collected on 20 people and can be found in the file . The data includes ownership of a handheld is indicated by y=1 and purchaser annual income x.

如果我不将收入分类,直接run出来的结果是income的相关性不高的,但是我又不知该如何分类。我试过按收入区间20000-30000,30000-40000这样分类,但结果还是不行。的确同样量太小了,但如果非要计算,该如何呢?在此求助了!!谢谢!!

The LOGISTIC Procedure

                                        Model Information

                   Data Set                      _PROJ_.PALMORG               
                   Response Variable             Ownership            Ownership
                   Number of Response Levels     2                             
                   Number of Observations        20                           
                   Model                         binary logit                  
                   Optimization Technique        Fisher's scoring              


                                         Response Profile
  
                                Ordered                       Total
                                  Value     Ownership     Frequency

                                      1            1              7
                                      2            0             13

                               Probability modeled is Ownership=1.


                                     Model Convergence Status

                          Convergence criterion (GCONV=1E-8) satisfied.         


                                       Model Fit Statistics
  
                                                           Intercept
                                            Intercept            and
                              Criterion          Only     Covariates

                              AIC              27.898         29.193
                              SC               28.894         31.184
                              -2 Log L         25.898         25.193


                             Testing Global Null Hypothesis: BETA=0
  
                     Test                 Chi-Square       DF     Pr > ChiSq

                     Likelihood Ratio         0.7051        1         0.4011
                     Score                    0.7045        1         0.4013
                     Wald                     0.6778        1         0.4104


                            Analysis of Maximum Likelihood Estimates
  
                                              Standard          Wald
               Parameter    DF    Estimate       Error    Chi-Square    Pr > ChiSq

               Intercept     1     -1.6008      1.3041        1.5068        0.2196
               income        1    0.000022    0.000027        0.6778        0.4104
1                                                           17:47 Saturday, February 15, 2003   2

                                      The LOGISTIC Procedure

                                       Odds Ratio Estimates
                                                
                                         Point          95% Wald
                            Effect    Estimate      Confidence Limits

                            income       1.000       1.000       1.000


                  Association of Predicted Probabilities and Observed Responses

                        Percent Concordant     70.3    Somers' D    0.418
                        Percent Discordant     28.6    Gamma        0.422
                        Percent Tied            1.1    Tau-a        0.200
                        Pairs                    91    c            0.709
The sample size is so small. If it is for learning purpose, that is fine. Otherwise it would be not very useful.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-2-23 08:54:17
2# bobguy
Yes, it's for learning purpose. But the result is not good. How should I classify the income variables to get a satisfactory result? Thanks a lot!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-2-23 10:57:11
frankling 发表于 2010-2-23 08:54
2# bobguy
Yes, it's for learning purpose. But the result is not good. How should I classify the income variables to get a satisfactory result? Thanks a lot!
In this case I cannot think of anything you can do. Sorry!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-2-23 11:02:14
4# bobguy

Becasue the sample size is so small, it's hard to get accurate result.
So I classify the income into two classes: high, y=1 (income >=40000) and low y=0 (income <40000).
and then run logistic regression. I get the result as below:     I think it's the only way.

The LOGISTIC Procedure

                                                    Model Information

                               Data Set                      _PROJ_.PALMORG               
                               Response Variable             Ownership            Ownership
                               Number of Response Levels     2                             
                               Number of Observations        20                           
                               Model                         binary logit                  
                               Optimization Technique        Fisher's scoring              


                                                     Response Profile
  
                                            Ordered                       Total
                                              Value     Ownership     Frequency

                                                  1            1              7
                                                  2            0             13

                                            Probability modeled is Ownership=1.


                                                 Class Level Information
  
                                                                        Design
                                           Class            Value     Variables

                                           income_class     0                 1
                                                            1                -1


                                                 Model Convergence Status

                                      Convergence criterion (GCONV=1E-8) satisfied.         


                                                   Model Fit Statistics
  
                                                                       Intercept
                                                        Intercept            and
                                          Criterion          Only     Covariates

                                          AIC              27.898         23.962
                                          SC               28.894         25.953
                                          -2 Log L         25.898         19.962


                                          Testing Global Null Hypothesis: BETA=0
  
                                  Test                 Chi-Square       DF     Pr > ChiSq

                                  Likelihood Ratio         5.9360        1         0.0148
                                  Score                    5.4945        1         0.0191
                                  Wald                     4.4339        1         0.0352
1                                                                                      10:09 Sunday, February 23, 2003   2

                                                  The LOGISTIC Procedure

                                                Type 3 Analysis of Effects
  
                                                                   Wald
                                     Effect            DF    Chi-Square    Pr > ChiSq

                                     income_class       1        4.4339        0.0352


                                         Analysis of Maximum Likelihood Estimates
  
                                                             Standard          Wald
                         Parameter         DF    Estimate       Error    Chi-Square    Pr > ChiSq

                         Intercept          1     -0.8959      0.6180        2.1014        0.1472
                         income_class 0     1     -1.3013      0.6180        4.4339        0.0352


                                                   Odds Ratio Estimates
                                                            
                                                            Point          95% Wald
                                  Effect                 Estimate      Confidence Limits

                                  income_class 0 vs 1       0.074       0.007       0.835


                               Association of Predicted Probabilities and Observed Responses

                                     Percent Concordant     59.3    Somers' D    0.549
                                     Percent Discordant      4.4    Gamma        0.862
                                     Percent Tied           36.3    Tau-a        0.263
                                     Pairs                    91    c            0.775
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群