全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
1248 1
2024-11-18

本文涵盖了Prism中可用的生存分析方法,包括Kaplan-Meier生存估计以及使用Cox比例风险回归进行生存分析。这两种方法截然不同,它们在各自的页面上都有详细的解释。


  • 生存分析的基本概念
  • Prism中的生存分析方法
  • 如何进行Kaplan-Meier(非参数)生存分析
  • Kaplan-Meier生存分析的结果
  • 如何进行Cox比例风险回归
  • Cox比例风险回归的结果




生存分析的基本概念

生存分析是一种用于了解给定时间发生概率如何随时间变化的工具。人们感兴趣的事件通常是死亡,因此,直到该事件发生所花费的时间就是个体的生存时间(这也是该分析名称的由来)。

以下提供一些关于生存分析的一般信息,重点介绍了生存分析区别于其他类型分析技术的一些独特方面。


  • 关键概念:生存曲线
  • 生存分析的目标
  • 删失数据






关键概念:生存曲线



生存分析是检查直到特定关注事件发生所经过时间量的过程。在许多实验中(特别是生物科学领域的实验),关注事件通常是研究对象(如小鼠、细胞等)的死亡。这些实验的响应变量是研究对象存活的时长(这也是这种分析名称的由来)。然而,生存分析同样适用于其他类型的涉及时间 - 事件数据的实验,例如测量机械部件直到损坏或失效所用的时间量,或者测量学生获得学位所需的时间量。在这些情况下,这种分析可能会有不同的名称(在经济学中,这些分析可能被称为“持续时间分析”或“持续时间建模”;在社会学中,这些研究可能被称为“事件史分析”)。然而,所有这些分析从根本上来说是相同的。

生存分析的一个主要结果是了解生存概率如何随时间变化。这种关系可以用生存曲线的形式在图形上呈现。这些曲线是针对给定的人群生成的,并将经过的时间绘制在X轴上,将生存概率(以分数或百分比形式)绘制在Y轴上。因此,曲线的位置被定义为相关人群中的个体在给定时间内不经历关注事件而“存活”的概率。考虑下面展示的示例生存曲线:

1.png


在这张图表中,我们可以看到生存曲线经典的“阶梯状”斜率。生存概率在图中以百分比给出,从时间为零时的100%开始,到大约83天左右降至0%。这种“阶梯状”形状是由于生存概率的计算方式导致的:生存概率仅在人群中有人出现关注事件(当关注事件是死亡时,这些是个体死亡的时间点)时才会改变,因此每一个垂直下降都代表了所研究人群中的一个事件。这些图表随后可用于确定有关单个人群的重要信息,如中位生存时间,或对多个具有各自生存曲线的人群进行统计比较。

上方的曲线是使用Kaplan - Meier方法创建的,本指南的这一部分将解释如何在Prism中进行Kaplan - Meier生存分析。

另一种生存分析技术——Cox比例风险回归——在Prism中也可用。



生存分析的目标

在生存分析中,响应变量是从某些定义的“开始时间”到一些其他定义的“结束点”所经过的时间量。这种经过的时间通常被称为生存时间,因为在这类研究中,“结束点”通常是死亡。几乎对于任何类型的生存分析,主要目标是估计或理解这个响应变量与一个或多个预测变量之间的关系。这些预测变量可能是由实验条件规定的事物(例如接受一种治疗与另一种治疗或对照),或者它们可能是观测变量(例如作为研究参与者的性别)。

例如,生存分析可用于通过测量接受新治疗的个体与接受标准治疗的对照组的生存时间,来检验新癌症治疗的效果。通过比较每组个体的生存时间,可以获得关于新治疗有效性的信息。

再举一个生存分析的例子,想象您为一家在不同实验室生产实验室设备的公司工作。您被要求研究特定部件在设备内的失效情况。除了测量每个设备导致部件失效的使用时间外,您还可能记录每个实验室内部的环境温度和相对湿度(假设这些条件不随时间变化)。在这个例子中,生存分析将允许您检查预测变量(温度或湿度)与设备内部件失效时间之间的潜在关系。


一旦建立了预测变量与生存时间之间的关系,这些信息也可以用于估计其他个体或个体随时间的生存概率(假设这些个体的预测变量值是已知的)。


这听起来很像多元线性回归

如果您熟悉多元线性回归模型,可能会觉得生存分析似乎在试图达成相同的目标(即揭示某些测量的响应变量和一组预测变量之间的关系)。正如后文将展示的,多元线性回归和一些生存分析技术(例如:Cox比例风险回归)之间存在一些相似之处。然而,生存数据有一些重要特征,导致典型的多元线性回归方法不适用于对此类数据的分析。

生存数据通常高度偏态


如前所述,生存分析的响应变量是每个观察对象(受试者、个体等)达到某个定义终点所经过的时间量。这对响应变量值的分布有一些重要影响。首先,由于我们在观察对象达到终点(无论是自然发生还是研究结束)之前不知道生存时间,存在一个“非信息性删失”的问题。其次,因为我们测量的是经过的时间,所有的值都是正数(生存分析中不存在“负时间”)。其次,在观察或抽样生存时间时,得到的值通常高度偏态。考虑下面展示5000个观察对象生存时间的直方图。


2.png


大部分生存时间都在1到3之间(几乎70%的观察到的生存时间都在这个范围内)。然而,有多个观察值远至13。直方图右侧的这些值表明分布具有“大右尾”,或者说该分布是“右偏态”的。这些数据是模拟的,但展示了在实际生存数据中经常观察到的右偏态分布的特征。由于这种偏态,许多基于正态(高斯)分布的假设和技术都不能使用。

删失数据


生存分析与标准线性回归技术之间的另一个主要区别是删失数据的普遍存在。这在生存分析中是一个非常重要的主题,因此在本文中它有自己的独立页面。



删失数据

“删失”这个术语似乎意味着您或研究对象做了一些不适当的事情。但事实并非如此。生存分析涉及测量每个观察对象(受试者、个体等)在样本群体中从某个定义的“开始时间”到其他定义的“结束点”所经过的时间量。通常,在生存分析中会存在某些观察结果,其经过的时间量是未知的。这些观察结果被称为“删失”,下面将通过一个例子来解释这种情况产生的原因,以便更容易理解。


考虑一个假设的临床试验,该试验计划持续6个月,并将招募20名参与者。该试验的入选标准是只有8名参与者在试验开始时被确定。其余12名参与者在接下来的四个月内被招募。每个参与者随后被跟踪,直到以下三件事情之一发生:



  • 参与者经历了所关注的事件(在这种情况下,参与者死亡)
  • 参与者退出研究
  • 研究在6个月后结束,但参与者在那时并未死亡



下图显示了研究中最初8名参与者的时间线,以及他们是否死亡(事件)或被删失的指示。

3.png


上面的图表在X轴上显示了“日历时间”(即自实验性试验开始以来所经过的时间)。由于最初的八名参与者在试验刚开始时(时间0)就进入了试验,所以从图表中可以直接读取到事件发生或删失的时间。

如上图所示,参与者01被跟踪了四个月,然后死亡。同样,参与者02和03分别被跟踪了两个月和一个月,然后各自经历了事件。参与者07被跟踪了6个月,就在研究结束前死亡。相比之下,参与者04被跟踪了整整6个月(他们存活到研究结束)。参与者05被跟踪了两个月,在此期间没有死亡。然而,在这两个月后,参与者05选择退出研究。参与者08也在仅一个月后离开了研究。注意参与者04和07之间的差异。虽然两者都参与了6个月的研究,但我们知道参与者07死亡了,而参与者04存活到研究结束。

对于参与者04、05和08,我们无法知道在他们经历事件之前经过了多少时间,只知道事件必须发生在他们观察期结束之后。从这最初的八名参与者中,我们只能说有五名经历了事件,而其他三名被删失了。

现在我们对这种可视化有了概念,我们可以查看研究中的所有其他参与者,以获得数据的完整图景。

4.png


另外12名参与者是在研究开始后招募的(参与者09– 20)。如前所述,上图在X轴上显示了“日历时间”。但我们可以看到,参与者09 - 20的“开始时间”不再是时间0。因为每个参与者的开始时间和结束时间可能不同,我们必须找到这两个值之间的差异,以确定每个参与者的“经过观察时间”。使用上图,我们看到这12名新参与者中有7名是在研究开始一个月后招募的,3名是在两个月后,还有2名分别是在三个月和四个月后。因此,我们不能简单地从图中读出事件发生或删失的时间,因为这些个体不是从时间0开始的。

在研究开始后招募的这12名参与者中,有1名(参与者18)在研究结束前离开了,且没有经历事件,导致另外3名参与者被删失,还有9名参与者有额外的事件观察。

这种删失方法被称为“右删失”,因为被删失的参与者的生存时间在图的右侧是未知的。换句话说,事件必须发生在这些参与者各自观察期之后。还有其他的删失方法(左删失和区间删失是最常见的),然而右删失是Prism中用于生存分析的方法。

以下部分的指南将介绍Prism提供的两种生存分析类型的信息:


  • 非参数生存分析:不允许有多个预测变量或连续预测变量。使用Kaplan – Meier(乘积限)方法来估计生存函数(生存曲线)。可以使用对数秩(Mantel- Haenszel、Mantel – Cox)和/或Gehan - Wilcoxon检验来比较不同组(由单个分类变量定义)的生存曲线。
  • 半参数生存分析:使用Cox比例风险回归来估计风险比和参数系数、基线累积风险和生存曲线,以及每个观察的生存概率估计。允许包含多个连续和分类预测变量。



第三种生存分析类型——参数生存分析——需要对样本群体中生存时间的分布做出额外假设,Prism中目前不提供这种分析。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2024-11-20 10:34:40
谢谢分享!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群