下面为引自本论坛资料,其原址是下面提供的链接,我一直也是这么认为的,因变量是二分变量,但是医学的东西很多没有是二分的,因此很多疾病的诊断可能是:正常,轻度,中度,重度,我认为这种情况下,为了划ROC曲线,应该变成二分变量,但是一个同学咨询统计老师的时候,那位老师说分的越细,就越准确,是否是因变量可以是非二分变量呀?
http://bbs.jobmet.com/thread-261339-1-1.html
ROC(Receiver Operating Characteristic)曲线,用于二分类判别效果的分析与评价.一般自变量为连续变量,因变量为二分类变量.
基本原理是:通过判断点(cutoff point/cutoff value)的移动,获得多对灵敏度(sensitivity)和误判率(1-Specificity(特异度)),以灵敏度为纵轴,以误判率为横轴,连接各点绘制曲线,然后计算曲线下的面积,面积越大,判断价值越高.
灵敏度:就是把实际为真值的判断为真值的概率.
特异度:就是把实际为假值的判断为假值的概率.
误判率:就是把实际为假值的判断为真值的概率,其值等于1-特异度.
将绘成的曲线与斜45度的直线对比,若差不多重合,说明自变量对因变量的判断价值很差,若越远离斜45度的直线即曲线下的面积越大,说明自变量对因变量的判断价值越好,即根据自变量可以较为正确的判断因变量.