配对t检验比较两组匹配样本的均数,假定前后差值的分布服从高斯分布。
如何进行配对t检验
1.输入数据
在“欢迎”(或“新表格与图形”)对话框中,选择“列”选项卡。
如果您尚未准备好输入自己的数据,请选择示例数据,然后选择“t检验-配对”。
将每个组的数据输入到单独的列中,匹配的值位于同一行。如果存在缺失值,这些行将被简单忽略。您还可以选择输入行标签,以标识每行数据的来源(即受试者的姓名首字母)。
2.选择配对t检验
a.在数据表中,点击工具栏上的“分析”图表
b.在列分析列表中选择“t检验”
c.在t检验对话框的第一个(“实验设计”)选项卡上,进行以下选择:
- 实验设计:配对
- 假定高斯分布:是
- 选择检验:配对t检验
d.在选项选项卡上,进行以下选择:
- 选择单侧或双侧P值。如有疑问,请选择双侧P值
- 选择差异的方向。此选择仅影响差异的符号以及差异的置信区间,而不影响P值
- 选择置信水平。除非有充分理由更改,否则保持为95%
3.查看结果
t检验用于探究两组均值之间的差异是由偶然因素引起的可能性。因此,最重要的结果是该差异的95%。置信区间和P值。
4.完善图形
- 前后对比图展示了所有数据。此示例将每个受试者绘制成箭头,以清晰显示从“之前”到“之后”的方向,但您可能更倾向于仅绘制线条,或带符号的线条
- 避免使用条形图,因为它只能显示每组的均值和标准差,而无法显示个体变化情况
- 要添加表示显著性水平的星号,可从结果表中复制并粘贴到图形上。这会创建一个实时链接,因此如果您编辑或替换数据,星号的数量可能会改变(或变为“无显著性”)。使用绘图工具在星号下方添加线条,然后右键点击并将箭头头设置为“半刻度向下”。
[size=14.6667px]
检验配对数据是否服从高斯分布
配对t检验假定所抽取的配对值样本来自一个配对总体,其中配对数据间的差值服从高斯分布。如果您想要检验该正态性假设,需要执行以下额外步骤:
- 在t检验对话框的“选项”选项卡中,选择“通过差值进行检验”
- 查看显示差值的结果表(t检验结果的一部分)。点击“分析”,然后选择“列统计”
- 选择您想要的正态性检验方法。我们推荐D'Agostino检验。请注意,默认情况下未选择任何正态性检验,因此您需要至少选择一个
- 如果P值表明您的样本数据很可能并非来自差值服从高斯分布的总体,请先解读正态性检验的信息
[size=14.6667px]
如果您的数据未通过正态性检验,您有两种选择。一种选择是转换数据值(例如转换为对数或倒数),以使差值的分布服从高斯分布。另一种选择是使用Wilcoxon配对符号秩非参数检验,而非t检验。
请注意,该假设是关于差值集合的。配对t检验并不假定两组数据各自均来自高斯分布总体,而仅假定差值服从高斯分布。
结果解读:配对t检验
置信区间
配对t检验用于比较两组配对样本的均值,因此首先关注两组均值的差值。Prism会显示该差值的置信区间。若分析的假设成立,您可以有95%的把握认为,95%置信区间包含两组均值的真实差值。
P值
P值用于判断两组均值的差异是否可能由随机因素导致。它要回答的问题是:
若两个总体的均值实际相同,随机抽样得到与本实验中观察到的均值差异(或更大差异)的概率是多少?
传统做法(虽非必要且往往并非最有用)是利用P值简单判定差异是否“具有统计学显著性”。
您对结果的解读会因P值是“小”还是“大”而不同。
t值
配对t检验用于比较两组配对样本。它先计算每组配对数据的差值,再基于“总体中差值服从高斯分布”这一假设,对差值列表进行分析。
首先,Prism计算每组配对数据的差值并记录符号。配对t检验的t值等于这些差值的均值除以差值的标准误。若t值很大(或为绝对值很大的负数),P值会很小。差值的方向(列A减列B,或列B减列A)可在t检验对话框的“选项”选项卡中设置。
自由度数量等于配对数减1。Prism通过t值和自由度计算P值。
配对有效性检验
采用配对实验设计进行配对检验的核心目的是控制实验变异性。实验中一些未控制因素会对“前测”与“后测”测量值产生同等影响,因此不会干扰“前-后测”差值,通过仅分析差值,配对检验可校正这些离散误差来源。
若配对有效,“前测”与“后测”测量值应协同变化。Prism通过计算皮尔逊相关系数r量化该协同性。基于r,Prism计算用于回答一下问题的P值:若两组数据实际完全不相关,随机选取的受试对象出现与您实验中观测到的相关系数(或更大相关系数)的概率是多少?由于您不关注强负相关可能性,此P值为单侧。
若配对有效,r为正且P值小,意味着两组数据显著相关,选用配对检验合理。
若P值大(如大于0.05),需质疑选用配对检验是否合理。您对是否采用配对检验的决策,不应仅基于此P值,还需结合实验设计及其他类似实验结果综合判断。
若r为负,说明配对起反作用!理想情况下,配对数据值应协同变动(一个值高,另一个也高),而负相关时情况相反(一个值高,另一个值低)。若r接近-1,应重新审视实验设计,因这种结果极不寻常,大概率源于随机误差。
描述性统计
描述性统计的“分析”选项卡仅汇总配对t检验用到的数据。若某列有数据而另一列无,无数据列的值不会纳入描述性统计结果,但常规描述性统计分析会涵盖所有数据。
分析核对清单:配对t检验
配对t检验用于比较两组匹配样本的均值,假设组间(如干预前-干预后)差值的分布符合高斯分布(正态分布)。
√差值是否服从高斯分布?
配对t检验假定所抽取的配对数值样本,来自配对差值服从高斯分布的配对总体。
尽管对于大样本,该假设重要性较低,但小样本时此假设至关重要。可使用Prism检验该假设。需注意,与非配对t检验不同,配对t检验不假设两组数据(典型示例中为干预前和干预后数据)所来自总体的方差相等。
√配对是否有效?
配对应是实验设计的一部分,而非数据收集后再进行的操作。Prism通过计算皮尔逊相关系数r及对应的P值,检验配对有效性。若P值小,说明两组数据显著相关,采用配对检验合理。
若P值大(如大于0.05),需质疑使用配对检验是否合理。您对是否采用配对检验的决策,不应仅基于此P值,还应结合实验设计及其他类似实验结果综合判断。
√配对是否相互独立?
仅当配对相互独立时,配对t检验结果才有意义,即导致配对值间差异(过高或过低)的因素,应仅影响某一对数据。Prism无法检验该假设,您需结合实验设计考量。例如,若有六组配对数据,实际来自三只动物的重复测量,此时动物个体因素可能使某只动物的“干预后-干预前”差值偏高或偏低,且会影响两组配对数据,那么这些配对并非相互独立。
√是否恰好比较两组数据?
t检验仅用于比较两组数据。若要比较三组或更多匹配组数据,应使用重复测量单因素方差分析(ANOVA)及后续检验。逐对进行多次t检验比较多组数据的做法不恰当。
√若选择单侧P值,预测是否正确?
若选择单侧P值,应在收集数据前就预测好哪组均值更大。Prism不要求记录该预测,但默认预测正确。若预测错误,应忽略报告的P值,说明P>0.50。
√您关注差值还是比值?
配对t检验分析配对数据间的差值。在部分实验中,差值间可能存在极大变异性,且当对照组数值越大时,差值也会越大。对于这类数据,若进行比值t检验,会得到更稳定的结果。
绘图技巧:配对t检验
配对t检验或Wilcoxon配对样本检验
上方图表展示了配对t检验的样本数据,注意以下几点:
- 由于数据是配对的,呈现数据的最佳方式是使用“前-后”对比图(如左侧图表所示)。仅展示“前测”和“后测”平均值的条形图,无法恰当呈现配对实验的结果
- 图表用箭头展示从“前测”到“后测”的变化序列。您可在“图表格式设置”对话框中选择,仅显示线条(不带箭头)
- P值是从配对t检验分析结果中复制粘贴而来
- 配对t检验首先计算配对数据间的差值。右侧图表展示了这些差值,可通过“移除基线”分析计算(不过无需单独操作)。在分析对话框的“选项”选项卡,勾选“绘制差值”选项即可
- 右侧图表中展示的均值差值的置信区间,是从配对t检验结果中复制粘贴而来
[size=14.6667px]
替代绘图技巧
1.使用成对比较功能(位于图表工具栏“绘图”区的按钮),可自动在两组间添加比较线和P值汇总信息。
2.使用估计图(配对t检验默认生成),展示两组间的平均差值,以及该平均值的95%置信区间。
配对t检验还是比率t检验?
配对t检验与比率t检验对比
配对t检验分析配对数据间的差值。对于每一对数据,先计算差值,再计算平均差值、该差值的95%置信区间,以及用于检验“平均差值实际为0”这一原假设的P值。
当差值是稳定的效应度量时,配对t检验适用。比如,对照组数值可能有波动,但处理组与对照组的差值是稳定的,能反映处理产生的效应。
但对于某些数据,对照组与处理组的差值并非稳定的效应度量。反而,对照组数值越大,差值也越大。这种情况下,比率(处理组/对照组)可能是更稳定的、用于量化处理效应的方式。
分析比率可能存在问题,因为比率本质上不对称——所有下降都表现为0到1之间的比率,所有上升都表现为大于1.0的比率。此时,分析比率的对数值更合理。无变化时对数值为0(1的对数),上升时为正,下降时为负。
比率t检验会先计算“处理组/对照组”比率的对数值的平均值,再检验“该组对数值的总体均值实际为0”这一原假设。
由于比率t检验基于对数运算,若有任何数值为0或负数则无法计算。若所有数值均为负,且确实想适用比率t检验,可对所有数值取绝对值后再进行比率t检验。若数值有正有负,用比率量化效应就不合理了。
比率t检验的计算流程
- 对数转换:将所有数值转换为对数值,即Y=log(Y)
- 配对t检验:对转换后的对数值进行配对t检验
- 还原几何均值:对数值差值的反对数,就是比率的几何均值
- 计算置信区间:计算对数值均值差值的各置信区间的反对数,得到比率几何均值的95%置信区间。注意对数和反对数的底数要匹配。若步骤1用的是常用对数(以10为底),此步骤就要计算10的“各置信限”次方
[size=14.6667px]
如何进行比率t检验
Prism可轻松对“列数据表格”中两列匹配数据执行比率t检验。
1.创建列数据表格:录入两列数据,同一行是匹配值,示例如下:
2.在数据表中,点击工具栏上的“分析”
3.从列分析列表选“t检验(及非参数检验)”
4.在t检验对话框首个(“实验设计”)选项卡,做如下选择:
- 实验设计:配对
- 分布假设:对数正态
- 选择检验:配对比率t检验
[size=14.6667px]
5.在t检验对话框第三个选项卡,选计算“处理组-对照组”,而非“对照组-处理组”。需注意,尽管是比率t检验(计算比率),对话框选项表述仍采用“差值(相减形式)”措辞
结果解读:比率t检验
示例
您测量了一种肾脏酶在处理前后的米氏常数(Km,单位为nM)。每个实验使用来自不同动物的肾脏组织,数据如下:
使用传统的配对t检验,对照组和处理组之间平均差值的95%置信区间为-0.72至9.72,包含零。P值为0.07。对照组和处理组之间的差值不足以表明存在统计学显著差异。这是合理的,因为配对t检验关注的是差值,而这些差值并不一致。
比率则更为一致,因此使用比率t检验是合理的。处理组/对照组比率的几何平均值为2.02,95%置信区间为1.88至2.16。数据清楚地表明,该处理使酶的Km值大约翻倍。
用配对t检验分析时,结果不明确。但当用比率t检验分析数据时,结果非常有说服力——该处理使酶的Km值翻倍。
P值为0.0005,因此处理的效果具有高度统计学显著性。
P值回答了这个问题:如果对照组和处理组的值之间实际上没有差异,获得与观察到的一样远离1.0的比率的概率是多少?如果P值很小,说明配对值之间实际上存在差异。
描述性统计
描述性统计分析选项卡仅汇总用于配对t检验的数据。如果某一列有数据而另一列没有,这些值不包含在描述性统计结果中。当然,常规描述性统计分析会分析所有数据。
分析核对清单:比率t检验
比率t检验用于比较两组匹配样本的均值,假定原始数据的分布服从对数正态分布。这等同于假定“处理前/处理后”比率的对数值服从高斯分布(正态分布)。
√对数(比率)是否服从高斯分布?
比率t检验假定所抽取的配对数值样本,来自配对“比率的对数值服从高斯分布”的总体。
尽管对于大样本,该假设重要性较低,但小样本时此假设至关重要。可使用Prism检验该假设。
√配对是否有效?
配对应是实验设计的一部分,而非数据收集后再进行的操作。Prism通过计算两列数据对数值的皮尔逊相关系数r及对应的P值,检验配对有效性。若P值小,说明两组数据显著相关,采用配对检验合理。
若P值大(如大于0.05),需质疑使用配对检验是否合理。您对是否采用配对检验的决策,不应仅基于此P值,还应结合实验设计及其他类似实验结果综合判断。
√配对是否相互独立?
仅当配对相互独立时,比率t检验结果才有意义,即导致配对值间比率(过高或过低)的因素,应仅影响某一对数据。Prism无法检验该假设,您需结合实验设计考量。例如,若有六组配对数据,实际来自三只动物的重复测量,此时动物个体因素可能使某只动物的“处理后-处理前”比率偏高或偏低,且会影响两组配对数据,那么这些配对并非相互独立。
√是否恰好比较两组数据?
t检验仅用于比较两组数据。若要比较三组或更多匹配组数据,应先将数值转换为对数值,再使用重复测量单因素方差分析(ANOVA)及后续检验。逐对进行多次t检验比较多组数据的做法不恰当。
√若选择单侧P值,预测是否正确?
若选择单侧P值,应在收集数据前就预测好哪组均值更大。Prism不要求记录该预测,但默认预测正确。若预测错误,应忽略报告的P值,说明P>0.50。
√您关注差值还是比率?
比率t检验分析配对值比率的对数值,假定比率是衡量实验效应的稳定指标。在许多实验中,您可能观察到配对值间的差值是稳定的效应衡量指标,而比率不是。这种情况下,应使用配对t检验,而非比率t检验。