全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
2614 2
2025-08-11

如何进行多重t检验

区分t检验分析与多重t检验分析

(单独)t检验(及非参数检验)分析和多重t检验(及非参数检验)分析,均用于比较两组数值。不过,两种分析对应的数据整理方式不同,需注意避免混淆。以下两部分将阐述二者差异。


(单独)t检验(及非参数检验)分析


  • (单独)t检验(及非参数检验)分析仅开展一次t检验,用于比较两列数据。
  • 该分析适用于“列”格式数据表,数据需录入两列,无并排重复项。每列应包含待比较两组之一的数值,重复值在列内“堆叠”。
  • 也可用于比较“配对”数据,配对数据需录入同一行,每组观测值对应录入相应列。


多重t检验(及非参数检验)分析


  • 多重t检验(及非参数检验)分析可一次性进行多次t检验,每次检验比较两组数据。
  • 适用于“分组”格式数据表,每次t检验的数据需录入数据表单行。两列(各含若干子列)代表待比较两组,每组重复值录入并排子列。
  • 也可用于比较“配对”数据,配对数据录入时,数值对需在组列的同一子列(如选配对检验,A列Y2子列数值与B列Y2子列数值配对)。
  • 注意:子列中堆叠的数值无需配对/匹配,A列第1行Y2子列数值与A列第2行Y2子列数值不匹配(违反此假设不影响结果)。



如何使用Prism进行多重t检验分析


  • 创建一个分组数据表(Grouped data table)。设置表格格式,可用于将重复值录入子列,或用于录入均值、标准差(SD)或标准误(SEM)及样本量n(配对检验需直接录入原始重复值,否则无法使用)。
  • 在两个数据列中录入数据。每一行数据将执行一次检验。
  • 点击“分析”,从分组数据的分析列表中选择“多重t检验(及非参数检验)——每行一次(Multiple t tests(and nonparametric) – one per row)”。
  • 选择如何计算每个检验,以及何时标记比较结果以进行进一步分析。



若要将分析结果中的P值复制/粘贴(或导出)到另一个表格或程序


注意,将P值(或校正后P值)复制到其他程序时可能出现的问题。若任何P值(或校正后P值)显示为类似“<0.000001”,复制粘贴时该值会被视为文本,可能被忽略。要避免此问题,需执行两项操作:


  • 在“偏好设置”的“分析”选项卡中,选择始终以科学计数法报告P值,或至少对极小的P值以科学计数法报告。


1.png


  • 在多重t检验分析的参数对话框中,选择报告小数后保留N位的P值,并为N录入一个较大数值。


2.png


完成这两项设置后,所有P值都将以数字形式呈现,“<”符号便不会出现,避免造成混淆。




多重t检验的选项

Prism为多重t检验(及非参数检验)分析提供了若干重要选项,让您能够从众多不同检验方法中选择一种,对数据表的每一行执行分析。


3.png


实验设计选项卡


“参数:多重t检验(及非参数检验)”分析对话框的第一个选项卡,提供了多个选项,用于明确要执行的分析类型,需回答以下三个问题:


  • 数据是配对的还是非配对的?
  • 检验时假设数据来自正态(高斯,Gaussian)分布、对数正态分布(lognormal distribution),还是不做分布假设(即非参数检验)?
  • (针对正态和对数正态分布假设情况)检验是否假设方差相等(即标准差或几何标准差相等,equal variances)?
  • 根据前两个问题的答案,Prism应执行哪种具体检验?
[size=14.6667px]

实验设计:数据是配对还是非配对?

第一个问题关乎待比较主要组内数据的关系。若选“配对”,意味着每列主列第一个子列的数据是配对/匹配的,每列主列第二个子列的数据也是配对/匹配的,以下是可选此选项的情况:


  • 在同一受试者不同时间点测量(如处理前和处理后)。
  • 对依据年龄、种族、疾病严重程度等特征招募或配对的个体进行测量。这种情况下,一人接受一种处理,另一人接受替代处理(或作为对照)。
  • 多次开展实验室实验,每次同时处理对照和受试样本。若实验条件不可控且存在细微差异,此点可能很重要。
  • 测量有内在配对关系个体的变量,如双胞胎或亲子对
[size=14.6667px]

注意:配对方式应由实验设计决定,绝不能基于待分析变量。例如,比较两组血压测量值时,可按年龄或体重匹配个体,但不能依据测得的血压值匹配。

分布假设

许多统计分析会对所分析数据的抽样总体做出特定假设,其中常见假设与数据抽样总体的分布相关。Prism提供三种选择:


  • 正态(高斯)分布:假设数据抽样自正态分布,比较组间均值。
  • 对数正态分布:假设数据抽样自对数正态分布,比较组间几何均值。
  • 非参数检验:不假设数据抽样自特定分布,而是使用非参数检验,通常相当于比较组内数据的秩次。
[size=14.6667px]


非参数检验不基于“数据抽样自高斯分布(或针对该检验的其他特定分布)”这一假设。虽看似更理想,但非参数检验效力更低,判断何时使用非参数检验并非易事。


为每一行选择检验方法


基于前两部分所选选项,在分析参数对话框的“实验设计”选项卡,需做最后一项决定:执行哪种具体检验。每行可执行七种检验,部分检验有额外选项需考量。以下介绍最后一部分的可用选项。


1. 非配对、正态(高斯)分布:在前两部分选此选项组合后,需对分析中每组的标准差做最终决策。

  • 第一个选择是,不对任意行或列数据抽样总体的标准差做假设。选此选项,Prism会执行“异方差非配对t检验,有时也叫Welch检验”。对于抽样自正态分布的非配对数据,这应作为默认选择。
  • 接下来可选择假设——对于每一行数据,两组数据均抽样自“标准差相同的总体”(即,第一列某行数据所选总体的标准差,与第二列同行数据所选总体的标准差相同)。这会执行“同方差非配对t检验”,为每行单独估算方差……
  • 本部分的最后一个选择允许假设所有数据(所有行的所有组)均抽样自具有相同标准差的总体。注意,这并非意味着您的样本标准差必须完全相同。相反,此处的假设是样本中的变异是随机的,且所有行的数据均来自具有相同标准差的总体。这是同方差假设,会带来更多自由度,进而提升检验效能。使用此选项时,Prism会执行具有单一合并方差的非配对t检验。
[size=14.6667px]


2. 配对、正态(高斯)分布:在前两个部分选择此选项组合,Prism仅会提供一种检验:

  • 配对t检验。此检验的原假设是每对数据差值的均值为零。
[size=14.6667px]


3. 非配对、对数正态分布:在前面两个部分选择此选项组合,会对分析中每组的标准差(这里实际围绕对数正态分布下的几何标准差逻辑)做出最终判定。

  • 第一个选择不对任何行或列数据所抽样自总体的几何标准差做假设。选择此选项,Prism会对每一行执行经Welch校正的对数正态t检验。对于取自对数正态分布的非配对数据,这很可能是您的默认选择。
  • 下一个选择是假设——对于每一行——两组数据均抽样自具有相同几何标准差的总体(换言之,第一列某一行数据所抽样自总体的几何标准差,与同一行第二列数据所抽样自总体的几何标准差相同)。注意,此假设等同于假设对数据转换后总体的方差相等。这会对每一行执行标准的、几何标准差单独估算的对数正态t检验。
  • 本部分的最后一个选择允许假设所有数据(所有行的所有组)均抽样自具有相同几何标准差的总体。注意,这并非意味着您的样本几何标准差必须完全一致。相反,此处的假设是样本中的变异是随机的,且所有行的数据均来自具有相同形状参数(几何标准差)的总体。这是同方差假设,会带来更多自由度,进而提升检验效能。使用此选项时,Prism会执行具有单一合并方差的非配对t检验。
[size=14.6667px]


4. 配对、对数正态分布:在前两个部分选择此选项组合,Prism仅会提供一种检验:

  • 比值t检验。此检验的原假设相对复杂。简而言之,检验的原假设是每对数据比值的对数的均值为零(换言之,每对数据的比值为1,因为log(1)=0)。
[size=14.6667px]


5. 非配对、非参数检验:选择此类选项组合后,需在以下两种检验中择一:

  • 曼-惠特尼检验(Mann-Whitney test):该检验的原假设较难理解,后文会展开讨论。但需注意,此检验的原理是:将两组数据的所有数值混合,按从小到大(无论数值来自哪组)排序,然后为每个数值分配一个秩次,最小数值秩次为1,最大数值秩次为n(n为数值总个数)。之后,检验对两组的平均秩次进行比较。
  • 科尔莫戈罗夫-斯米尔诺夫检验(Kolmogorov-Smirnov test):其原假设也很难理解,它假定两组数据来自分布相同的总体。该检验利用数据的累积分布,检验原假设是否被违背(如中位数不同、方差不同或分布不同)。
[size=14.6667px]


6. 配对、非参数检验:选择此类选项组合后,仅有唯一一种检验可选。

  • 威尔科克森配对符号秩检验(Wilcoxon matched-pairs signed rank test):这种非参数检验先计算两组配对数据间的差值,将差值按绝对值排序,再比较“第一组配对值更大时的秩次和”与“第二组配对值更大时的秩次和”。
[size=14.6667px]

多重比较选项卡

当一次性进行大量t检验时,通常目的是筛选出差异大到值得进一步研究的对比子集。Prism提供两种方法,用于判定在进行多重t检验(及非参数检验)分析后,双侧P值小到足以让某一对比值得开展进一步研究的情况。

一种方法基于大家熟知的“统计显著性”概念。

另一种选择是依据“假发现率(FDR,推荐)”来做决策。控制FDR的整体思路,和判定某些对比“具有统计显著性”的思路大不相同。这种方法不用“显著”一词,而用“发现”。您需设定Q值,它代表期望的、“发现”中属于假发现的最大百分比。换句话说,就是期望的最大FDR。

在所有标记为“发现”的数据行中,目标是:因数据的随机波动产生的假发现占比不超过Q%,同时至少有100%-Q%的“发现”,是总体均值间的真实差异。Prism提供三种控制FDR的方法。


4.png











如何处理多重比较

若您选择假发现率(False Discovery Rate)方法,需为Q选定一个值,Q即您可接受被证明为错误的“发现”的百分比。输入百分比,而非小数。若您愿接受5%的“发现”为假阳性,输入5,而非0.05。您还需选择使用何种方法。


若您选择统计显著性方法,需就多重比较额外做一决策。有四个选择:


  • 使用Holm-Šídák法校正多重比较(推荐)。您指定想要用于整个系列P值比较的阈值水平α。该方法设计目的是,若每一行比较的零假设实际为真,指定的α值代表得出一个或多个“显著”P值的概率。
  • 使用Šídák-Bonferroni法校正多重比较(不推荐)。我们推荐Holm-Šídák法,因其功效更强。Šídák-Bonferroni法(常简称为Šídák法),比单纯的Bonferroni-Dunn法(常简称为Bonferroni法)功效略强。当您进行大量比较时,这点尤为明显。
  • 使用Bonferroni-Dunn法校正多重比较(不推荐)。Bonferroni-Dunn法理解起来更简单,比Holm-Šídák法更知名,但无其他优势。Bonferroni-Dunn法与Šídák-Bonferroni法的主要区别在于,Šídák-Bonferroni法假设每次比较相互独立,Šídák-Bonferroni法假设每次比较相互独立,而Bonferroni-Dunn法不做此独立性假设。因此,Šídák-Bonferroni法功效比Bonferroni-Dunn法略强。
  • 不对多重比较进行校正(不推荐)。每个P值单独解读,不考虑其他P值。您为显著性水平α设定一个值,通常设为0.05。该值作为与P值比较的阈值。若P值小于α,则该比较被视为“统计显著”。若使用此方法,您会得到大量假阳性结果(即很多被判定为“显著”的发现,最终被证明不属实)。在某些情况下这没问题,比如药物筛选,多重t检验的结果仅用于设计下一步实验。
[size=14.6667px]

“选项”选项卡

“参数:多次t检验(及非参数检验)分析”对话框的第三个也是最后一个选项卡,为设置分析结果的报告方式,以及Prism将从该分析中生成哪些图表和可视化内容,提供了一些重要控制项。


5.png




计算


在本部分,您能够选定分析中两组进行比较的顺序。例如,您或许希望结果报告为“处理组-对照组”,而非默认的“对照组-处理组”。需注意,这不会改变检验的整体结果,只会改变差值的“符号”。


  • -log10(P值):该转换用于绘制结果的火山图,可生成P值的表格。
  • -log20(P值):这是计算所得P值的以2为底的对数,有时被称为“Shannon信息值”、“Surprise值”或“S值”。对P值进行这种简单转换,能以直观方式理解P值。应用此转换后得到得值(S值),可按如下方式解读:假设我们得到一个P值为0.125,对应得S值为-3(因此以2为底0.125得对数是-3)。得到P值0.125时,我们应感到得“惊喜程度”,就如同抛硬币三次,每次都正面朝上(不算太令人惊讶)。再看P值为0.002,对应得S值约为-9,得到P值0.002时,我们应感到的“惊喜程度”,就如同抛硬币九次,每次都正面朝上(相当令人惊讶)。
[size=14.6667px]

绘图选项

此处的复选框(默认启用)会让Prism依据您的数据创建火山图。X轴为每一行的均值差值,Y轴为P值的转换值。具体而言,绘制的是P值的负对数。若P=0.01,log(P)=-2,则-log(P)=2,并据此绘图。这样,差值越大的行,在图表的左右边缘越靠外;P值越小(即越显著)的行,在图表中位置越高。

Prism会自动在X=0(误差值)处绘制一条垂直网格线,在Y=-log(α)处绘制一条水平网格线。水平网格线以上的点,其P值小于您选定的α(显著性水平)。

输出

在该选项卡的最后部分,有一些控制项,可让您设定分析结果中(除P值外所有内容)显示的有效数字位数,以及报告P值时采用的样式。





解读结果:多重t检验

结果展示在多个页面中。

分析摘要页

本页呈现所执行特定检验的信息(依据“参数”对话框中所选选项)。除列出输入数据表中经分析的两列外,还给出包括特定检验名称、方差假设、多重比较的计算与报告方法,以及所执行/省略的检验数量等信息。


t检验页

本页按行展示所执行的检验。会显示每个比较的P值,以及多重性调整后的P值(经调整后更高)。此外,若在“参数”对话框的“选项”标签页中选定,还会纳入P值的变换形式,这些变换包括用于火山图的-log10(P值),以及-log2(P值,也称为“S值”或“Surprise值”)。


若您选择统计显著性方法,第一列标记为“低于阈值?”,会以“是”或“否”表明比较得出的P值在经多重比较调整后,是否小于指定的阿尔法水平。在早期Prism版本中,本列会显示单个星号(表明某一比较被判定为统计显著)或无星号(表明不显著)。但无论对应P值如何,它从未显示多个星号。为避免混淆,该标注已替换为简单的“是”或“否”。若您选择FDR(假发现率)方法,第一列标记为“发现?”,包含见到那的“是”或“否”,表明这些行是否被视为“发现”(即P值足够小)。


符合条件的结果页(P small enough and Discoveries page)

本页仅显示符合“低于阈值”或“发现”标准(基于您在对话框中的选择)的行。行按P值排序,最小P值排最前。

什么是n?

在大多数情况下,每行都有完整数据,t检验数量等于行数,不存在歧义。


在某些情况下,可能无法为部分行计算t检验(因重复样本的标准差为0,或因每组仅有一个值)。Prism仅统计可计算t检验的行。若某些行无法计算t检验,Prism会在浮动注释中指出。





多重t检验生成的火山图

什么是火山图?

当您运行多重t检验时,Prism会自动创建一种名为火山图的图表。


6.png


每个点代表数据表中的一行。

X轴绘制的是均值差值。在X=0处会显示一条虚线网格线,代表无差异。


Y轴绘制的值取决于您的选择:


  • 若您选择不进行多重比较校正的统计显著性方法,火山图的Y值为P值对数的负数(以10为底)。例如,若P值为0.01,其对数(以10为底)是-2,那么Y轴绘制的值就是2.0。
  • 若您选择进行多重比较校正的统计显著性方法,Y轴为多重性调整后P值对数的负值(以10为底)。
  • 若您选择FDR(假发现率)方法,Y轴绘制的是q比值对数的负值(以10为底)。
[size=14.6667px]


备注





  • 所有对数均以10为底。
  • 若您使用统计显著性方法,Prism会自动在X=0(无差异)处绘制一条线,且Y=-log10(alpha)处绘制一条线;若您选择FDR方法,则在Y=-log10(q)处绘制线。
  • 火山图会自动生成,Prism未提供不生成它的选项,但删除它也很容易。
  • 您常会看到X轴为两组均值比值的火山图。但t检验关注的是差值,而非比值。若您关心比值,可考虑将所有值转换为对数,再运行多重t检验分析。这利用了“两个对数值的差值等于其比值的对数”这一特性。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2025-8-11 20:02:55
谢谢楼主,在默默地推广这个软件。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2025-8-12 20:45:27
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群