lanhong1993 发表于 2016-12-7 15:07 
临床普遍认为,PaO2太低会增加危重病人的死亡概率。现在又有理论提出,PaO2太高也会增加病人死亡率。所以 ...
业务背景我了解啦。
那么基于你介绍的业务背景。我有两点建议。
1.用什么模型。 如果你认为过高,过低都会提高死亡率。那么显然,用逻辑回归是有问题的。
因为逻辑回归的假设是S型曲线的概率。 那么建议你用随机森林。
2.为什么说我们用几个统计值就能代表你背后几十次的测量。
就比如量血压。 病人说我血压高。你问,平时血压多高啊。 他回答160/110. 这个值怎么来的。是他的平时测量积累的平均值。就代表了某种普遍性。 做统计的,我们再加个标准差。比如标准差10. 那么基本就是假定在160/110 上下两个标准差波。我们不必知道每一次测量结果,就足以知道每次测量值大致落在怎样的范围。
考虑到这是个典型的时间序列,我建议采取以下几种指标。
1.差分的平均值
2.差分的方差。
3.初始值,
4.终值
5.平均值(其实这个已经没啥用,实际,有一个初始值或者最终值就够了)
前两项,确定了这个时间序列的趋势。差分平均值 决定趋势,向上,向下,还是上下浮动。差分的方差,决定了波动的幅度大小。 后三项,基本说明 所处的基本水平。
这几个值基本上能描述出这个时间序列的特点了。