操作指南
How to: Nestedone-way ANOVA
结果解读
Interpreting results:Nested t test
分析核查清单
Analysis checklist:Nested one-way ANOVA
操作指南
Howto: Nested one-way ANOVA
本示例源自优秀在线统计教材《如何避免与发现统计不当操作》。该研究评估了两种病媒控制方法与无控制组对牛红细胞压积(PCV)的影响。3个牛群被随机分配至3种处理组之一,从每个牛群的4头牛中采集血样并记录红细胞压积。
我们关注的因素是处理组,嵌套因素是牛群。每个牛群仅接受一种处理。因此牛群嵌套于处理组中。
1.数据录入
创建嵌套表,并根据实际重复数设置子列数。本示例中每个处理组包含3个牛群,因此需创建含3个子列的表格。
以堆叠重复样本数据的方式录入每头牛的测量值。若要为子列添加合适标签(如“Herd1”等),双击子列标题,在弹出对话框中输入子列名称。
注意事项:
- 重复数据采用堆叠格式,这与Prism常规操作不同。设置原因有二:一是便于为子列添加标签(如“Herd1”“Herd2”);二是与多数教材的分析格式保持一致。若将技术重复并排录入,Prism的嵌套t检验将得出无意义结果。
- 每个子列内的数据顺序是任意的,随机打乱子列数据不会改变分析结果;第2行各数值之间无对应匹配关系。
- 子列顺序不影响结果,交换Herd2与Herd3的数据后分析结果不变;对照组与处理组的对应子列之间无关联。
- 本示例中每个子列样本量均为4,但嵌套单因素反差分析不要求样本量相等,可直接处理不均衡样本。
- Prism将此方法命名为“嵌套单因素方差分析”,更贴合实际用途;多数教材称其为“嵌套双因素方差分析”,因一个因素(本实例为牛群)嵌套于另一因素(处理组)中。
- Prism无法处理超大型数据集的嵌套ANOVA分析,遇此情况会弹出提示。
2.执行分析
点击分析按钮,然后在分组分析列表中选择[嵌套单因素方差分析(nested one-way ANOVA)]。
在第一个选项卡中,选择是否为每个数据集生成总均值与95%置信区间的图表,以及是否在表格结果中显示拟合优度(goodness of fit)。
第二个选项卡提供多重比较选项,第三个选项卡提供多种残差绘图选择。
结果解读
Interpretingresults: Nested t test
主要结果
- 嵌套方差分析:该P值检验原假设,3列(本示例中为处理组)的总体均值相等。
- 随机效应:子列均值间变异与子列内变异,同时以标准差(更便于科研人员理解)和方差(统计学家更熟悉)两种形式呈现。
- 子列间差异(各列内部):该P值检验原假设,所有子列数据均来自标准差相同的总体。
- 拟合优度(可选):若选择此选项,Prism将报告自由度和限制性最大似然估计(REML)准则,这仅对熟悉混合模型的统计学家有意义。
多重比较
多重比较的执行方式与单因素方差分析一致。在本示例中,使用Dunnett检验将两种处理组分别与第三列的对照组进行比较是合理的,以下是结果。
分析核查清单
Analysischecklist: Nested one-way ANOVA
嵌套单因素方差分析用于比较3个及以上独立组的均值,且这些处理组内部存在嵌套因素。
√残差是否服从高斯分布?
嵌套方差分析假设残差(多数情况下为技术重复间的变异)服从高斯分布。根据中心极限定理,样本量较大时该假设的重要性会降低。
嵌套t检验对话框的第三个选项卡提供多种残差绘图方式,用于评估正态性。
√各子列内的变异是否方差齐性?
嵌套方差分析假设各子列数据均来自标准差(方差)相同的总体。Prism不直接检验该假设,但可通过观察数据判断是否严重违背。
可尝试对数值取对数后再进行ANOVA,有时能使方差更接近齐性。
√子列均值间的变异是否服从高斯分布?
嵌套单因素方差分析假设子列均值间变异、以及子列内重复测量值均服从高斯分布。
√确实想要比较均值吗?
嵌套方差分析用于比较3个及以上组的均值。即使分布重叠程度较高,也可能得到极小的P值,明确提示总体均值存在差异。在某些场景下(如评估诊断试验的实用性),可能更关注分布的重叠程度,而非均值差异。
√主因素是否为“固定效应”而非“随机效应”?
Prism默认组(数据集)为固定效应,即仅检验所采集数据的特定组间均值差异。若组(数据集)为随机效应(即从无限/大量潜在组中随机选取,且希望推断所有组间的差异),则Prism无法执行嵌套ANOVA。
注意:Prism默认嵌套因素为随机效应。
√不同列是否代表分组变量的不同水平?
嵌套单因素方差分析用于检验单个变量在3个及以上组间是否存在显著差异。在Prism中,每组数据单独录入一列。若不同列代表不同变量(而非不同组),则单因素方差分析不适用。例如:若A列为血糖浓度、B列为胰岛素浓度、C列为糖化血红蛋白浓度,则单因素方差分析无意义。