各位大神好。
楼主最近开始研究Survival Analysis, 里面除了常规的用 Cox回归之外,某篇文章上还提到了用Cubic Spline Regression的法子,但介绍得语焉不详,比如从头到尾,上来怎么预处理数据,怎么建模,怎么确定节点和对应参数,怎么确定具体的函数形式,等等
所以这里想问的是,各位大拿有什么好的用SAS实现三次样本插值回归的技术文档/参考书,或者样例程序能参考借鉴学习一下的吗?这里先行谢过了!
关于Cubic Spline, 我个人的粗浅理解是:
在生存分析里因为风险函数hazard risk的形状经常不规则,绝大多数情况不可能是正态分布(甚至做一次对数转换后也不规则),但因为风险几率总是个非负值,所以Cox回归里用指数函数来拟合。但有时候对于形状实在没规律的hazard函数,Cubic Spline是一个更灵活的分段插值拟合的办法,至于为啥是三次方,我想一次方对应的是线性,二次方嘛里头必须有对称,所以撑到三次方来拟合就比较灵活,优点嘛是可以更加逼近原始函数形态,但参数变多了一个增加计算开销,另一个数据样本不够的时候容易造成overfitting.