请教大神：为何我的logistic模型拟合值yhat（标签：估计概率）基本都大于50%呢？

2176

收藏 2015-02-05

请教大神：
      为何我的logistic模型拟合值yhat（标签：估计概率）基本都大于50%呢？
      我有710个样本，其中被解释变量取1的为500家，取0的为210家。模型的ADJ.R2为20.5%。
      我在模型后面添加了“output out=est p=yhat”，没想到估计概率（yhat）基本都大于50%，也就是说，基本上全部样本都认为“事件会发生（取值为1）”
   这科学吗？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

bridge1989

2015-2-5 20:00:56

估计概率不能和50%直接比较吧

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

lizhewenbei

2015-2-5 22:49:27

bridge1989 发表于 2015-2-5 20:00
估计概率不能和50%直接比较吧

请问那该如何人工判断划归哪一拨呢？根据拟合的模型，我们应当要对原始数据有所判断啊

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

jingju11

2015-2-6 12:11:09

Yeah. It is more likely to be an event than being a non-event from your results.
We send mails to customers for asking credit cards application. The response rate is < 5%. In a logistic model, the best prediction for almost all customers is always a non-response (event =0). On the other hand, we do see some groups are more tended to apply cards than others (OR >1). That is what we had learned from wasting so many junk mails.
JingJu

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

lizhewenbei

2015-2-6 15:11:23

jingju11 发表于 2015-2-6 12:11
Yeah. It is more likely to be an event than being a non-event from your results.
We send mails to ...

非常感谢！您样本中，大多数人不愿意申请信用卡（0很多），极少数人愿意申请信用卡（1很少）。拟合logistic模型后，如果我们将该模型适用于您的这个原始样本（而不是另一个群组），会出现什么样的情况呢？应当大多数样本被判定为“愿意申请信用卡（事件1）”的概率低于50%吧？但是我的这个情况更为奇怪，原始样本的1约占70%，0约占30%，然而回归模型判识几乎98%的样本应当发生事件（估计概率大于50%），请问这种情况是否正常？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群