Ridit分析在等级资料分析中的应用
梁士杰
在医学资料中,常常遇到一些定性指标,如临床疗效的评价、疾病的临床分期、症状严重程度的临床分级、中医诊断的一些临床症状等,对这些指标常采用分成若干等级然后分类计数的办法来解决它的量化问题,这样的资料我们在统计学上称为有序变量(ordered variable)或半定量资料,也称为等级资料(ranked data)。
一般情况下,对于等级资料常用的统计分析有非参数统计的秩和检验、Kendall-spearman等级相关、CMH卡方检验、Ridit分析、线性趋势卡方检验、有序变量的Logistic回归分析。
而对于多组等级资料的两两比较统计学中常用的就是Ridit分析。Ridit分析是一种关于等级资料进行对比组与标准组比较的假设检验方法。
一、Ridit分析适用范围及特点
1、两组或两组以上等级资料的比较和分析;
2、两端数据不确切的计量资料分组转换成计数资料的分析,如血清滴度等;
3、其特点为简便、直观、适用性广。
二、Ridit分析步骤
Ridit 分析是把原本不适宜用t检验和u检验的离散型等级资料转换成连续型的计量资料, 从而可求出标准误和估计总体值的置信区间 , 建立t 检验和 u 检验对之进行处理。Ridit分析的步骤是:
(一)选择标准组。
假如资料涉及两组、r个等级, 要比较两组等级间有无差异。首先需要确定参照组, 以便利用变换求该参照组的Ridit值。当两组中有一组例数明显多于另一组,或者该组为通常选用的传统方法, 则选该组作为参照组; 当两组的例数没有明显区别, 也不存在传统参照之分,可把两组的对应等级例数进行合计后构成参照组。
假如资料分f个等级, 分组变量有r (r > 2) 个组,要比较r个组等级间有无差异(以下所涉及多组资料均以此为准) 。如果存在某一组的例数特别多于其他组,可将该组选为参照组; 否则, 宜采用各等级下各组例数的合计作为参照组。
(二)计算标准组的平均Ridit值。
(三)利用参照组计算各组的平均Ridit值。
(四)判断结论。
1、置信区间判断法。
当等级数f 较大时, 我们可利用均匀分布标准差构造各组粗略置信区间。当等级数 f 较少时, 我们宜用样本标准差替代构造各组精确置信区间。如果Ridit值是按照合计组计算的, 我们可以通过两组置信区间有无重叠进行差异比较。如果有较多重叠,说明两组间等级无显著差异;如果无重叠说明有差异;如果两组间重叠较少宜采用统计检验法进行精确比较。
一般情况下,以各组的95%可信限与标准组R=0.5比较,如可信限不包括0.5在内则认为差别有显著性,否则为无显著性。
2、统计量检验法
(1)u检验法。
样本组与标准组比较情况下,如果是采用标准组计算的 Ridit 值 , 此时要比较其它组与标准组的差异,可根据该组的平均Ridit 值的样本标准差构造u检验统计量。在无标准组的任意两组比较情况下,如果是采用合计组计算的Ridit值 , 且两组平均Ridit 值的置信区间有较少重叠, 我们不能简单地用置信区间作比较,可采取近似u 检验法。可根据两组的平均Ridit值、Ridit值的样本标准差构造u检验统计量 。
检验结论:如果检验统计量的观测值的绝对值大于临界值 uα/2 , 则在显著水平α下得出样本组分布与标准组分布有显著差别。可结合检验统计量观测值的正负和等级的具体意义说明结论的实际含义 。
(2)t检验
同样针对组等级比较问题, 我们也可根据两组的平均Ridit值和均匀分布的标准差构造粗略t检验法。
检验结论: 由于 两样本的自由度通常大于 30 ,我们仍然用如果检验统计量的观测值的绝对值大于临界值μα/2 , 则在显著水平α下得出两组间的差别情况。
( 3) χ2检验
医学工作中要比较两组以上 ( r 组) 的等级资料的分布间有无差别 , 可进行多样本的 Ridit 分析,可采用χ2值做为统计量。
三、Ridit 分析的正确使用
Ridit分析主要想考察两组或多组等级间是否有差异的问题,它是基于非参数的角度建立的比较方法,也就不考虑资料的可能分布。决定采用什么统计方法进行处理, 首先应根据资料的性质和问题的实际处理目的进行选择, 其次所选方法要具有高的检验效能。如果不考虑“ 等级”概念, 或者分布形式已知, 则可结合其他方法进行分析。
(一)根据资料的处理目的的不同进行选择
以药物疗效为例,按照独立性χ2检验的处理目的虽然知道两种治疗方式的疗效有差别 , 但不能综合判断那种治疗方式的疗效好 , 其根本原因是没有考虑疗效的等级性即随着等级的增加疗效更好 。因此,如果要强调等级趋势以及综合判断分类变量水平间等级变量的好坏, 应选择 Ridit 分析或其他等级分组资料的处理方法。
(二)根据检验方法的效能进行选择
检验的效能是指利用检验统计量做出正确判断的概率, 但由于备择假设的范围很广, 直接求出检验的效能往往是件困难的事, 但我们可以用统计模拟的方法对两种或多种检验方法的效能进行比较, 它与资料可能的分布密切相关。
(三)根据资料对象的要求进行实验安排
在使用Ridit分析之前 ,要具体核实所获得的数据是否满足Ridit 分析的数据要求。