全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
2095 4
2015-02-05
请教大神:
        为何我的logistic模型拟合值yhat(标签:估计概率)基本都大于50%呢?
        我有710个样本,其中被解释变量取1的为500家,取0的为210家。模型的ADJ.R2为20.5%。
        我在模型后面添加了“output out=est p=yhat”,没想到估计概率(yhat)基本都大于50%,也就是说,基本上全部样本都认为“事件会发生(取值为1)”
       这科学吗?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-2-5 20:00:56
估计概率不能和50%直接比较吧
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-5 22:49:27
bridge1989 发表于 2015-2-5 20:00
估计概率不能和50%直接比较吧
请问那该如何人工判断划归哪一拨呢?根据拟合的模型,我们应当要对原始数据有所判断啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-6 12:11:09
Yeah. It is more likely to be an event than being a non-event from your results.
We send mails to customers for asking credit cards application. The response rate is < 5%.  In a logistic model, the best prediction for almost all customers is always a non-response (event =0). On the other hand, we do see some groups are more tended to apply cards than others (OR >1). That is what we had learned from wasting so many junk mails.
JingJu
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-6 15:11:23
jingju11 发表于 2015-2-6 12:11
Yeah. It is more likely to be an event than being a non-event from your results.
We send mails to  ...
非常感谢!您样本中,大多数人不愿意申请信用卡(0很多),极少数人愿意申请信用卡(1很少)。拟合logistic模型后,如果我们将该模型适用于您的这个原始样本(而不是另一个群组),会出现什么样的情况呢?应当大多数样本被判定为“愿意申请信用卡(事件1)”的概率低于50%吧?但是我的这个情况更为奇怪,原始样本的1约占70%,0约占30%,然而回归模型判识几乎98%的样本应当发生事件(估计概率大于50%),请问这种情况是否正常?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群