全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
4195 11
2011-05-03
悬赏 15 个论坛币 未解决
在做判别分析和logistic模型的时候,往往要确定临界点,用来划分违约和不违约的企业,以判别分析为例,比如我现在有如下5行数据
status      score
1             -4.7
1            -9.0
0           -8.6
0           -7.5
0          -3.4
status表示违约状态,1表示违约,如何用SAS找到一个最优的score 使得判别的准确率最高, 比如大于这个临界值是判别得到的status为0,小于时为1,判别的准确率最高也就意味着根据判别准则得到的status和真实的status(上面给出的status变量)相同的程度最大。当然实际结果的数据量远远大于5行,求好朋友们帮帮忙!谢谢了!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-5-3 22:37:30
自己顶....真的对自己也重要..希望好心人出现.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-5-4 00:33:31
这个问题其实最笨的办法就是用do循环一个一个的试试看,比如do value=0 to 1 by 0.01之类的,同时输出misclassification rate,选最低的那个。具体可以参考:http://www2.sas.com/proceedings/forum2008/231-2008.pdf
不过,这里有个提醒,一般说来cut-off value是有一定业务含义的,如果单纯从数据的角度来看,有时候并不合理。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-5-4 06:47:46
这个应该是用一个算法。可以考虑把Status=0和status=1分别保存,并排序。如果Status=0里最大的数小于Status=1里最小的数,那么准确率是100%。如果不行,往下继续找,直到找到合适的,应该就是准确率最高的点
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-5-4 09:05:44
456852 发表于 2011-5-4 00:33
这个问题其实最笨的办法就是用do循环一个一个的试试看,比如do value=0 to 1 by 0.01之类的,同时输出misclassification rate,选最低的那个。具体可以参考:http://www2.sas.com/proceedings/forum2008/231-2008.pdf
不过,这里有个提醒,一般说来cut-off value是有一定业务含义的,如果单纯从数据的角度来看,有时候并不合理。
非常同意!
训练集合的绝对最优cut-off是没有什么意义的
结合具体应用的业务背景吧。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-5-4 11:32:19
3# 456852
非常同意您对于临界点确定的看法,即临界点的看法跟决策者的风险偏好有关,我用这个是用来写毕业论文的,是假定风险中性的,呵呵...希望找到理论意义上的临界点..非常感谢您的帮助!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群