如何用SAS找到一个最优的score 使得判别的准确率最高

xiaoli198778

4368

收藏 2011-05-03

悬赏 15 个论坛币未解决

在做判别分析和logistic模型的时候，往往要确定临界点，用来划分违约和不违约的企业，以判别分析为例，比如我现在有如下5行数据
status    score
1          -4.7
1          -9.0
0          -8.6
0          -7.5
0       -3.4
status表示违约状态，1表示违约，如何用SAS找到一个最优的score 使得判别的准确率最高，比如大于这个临界值是判别得到的status为0，小于时为1，判别的准确率最高也就意味着根据判别准则得到的status和真实的status（上面给出的status变量）相同的程度最大。当然实际结果的数据量远远大于5行，求好朋友们帮帮忙！谢谢了！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

xiaoli198778

2011-5-3 22:37:30

自己顶....真的对自己也重要..希望好心人出现.

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

456852

2011-5-4 00:33:31

这个问题其实最笨的办法就是用do循环一个一个的试试看，比如do value=0 to 1 by 0.01之类的，同时输出misclassification rate，选最低的那个。具体可以参考：http://www2.sas.com/proceedings/forum2008/231-2008.pdf
不过，这里有个提醒，一般说来cut-off value是有一定业务含义的，如果单纯从数据的角度来看，有时候并不合理。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

junuylia

2011-5-4 06:47:46

这个应该是用一个算法。可以考虑把Status=0和status=1分别保存，并排序。如果Status=0里最大的数小于Status=1里最小的数，那么准确率是100%。如果不行，往下继续找，直到找到合适的，应该就是准确率最高的点

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

soporaeternus

2011-5-4 09:05:44

456852 发表于 2011-5-4 00:33
这个问题其实最笨的办法就是用do循环一个一个的试试看，比如do value=0 to 1 by 0.01之类的，同时输出misclassification rate，选最低的那个。具体可以参考：http://www2.sas.com/proceedings/forum2008/231-2008.pdf
不过，这里有个提醒，一般说来cut-off value是有一定业务含义的，如果单纯从数据的角度来看，有时候并不合理。

非常同意！
训练集合的绝对最优cut-off是没有什么意义的
结合具体应用的业务背景吧。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

xiaoli198778

2011-5-4 11:32:19

3# 456852
非常同意您对于临界点确定的看法，即临界点的看法跟决策者的风险偏好有关，我用这个是用来写毕业论文的，是假定风险中性的，呵呵...希望找到理论意义上的临界点..非常感谢您的帮助！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群