在未来几十年内,受大气二氧化碳含量增加产生的温室效应等诸多因素的影响,全球气候变化将给我国小麦生长带来不利影响,北部和西南各冬麦区干旱进一步加剧,而长江中下游冬麦区湿害加重。去年,全国农技中心组织相关专家开展了2013年我国小麦条锈病秋苗考察,结果显示甘肃省、青海省秋苗发病普遍,病田率在80%以上,加之近期土壤湿度大,雨水偏多,这些因素也对条锈病的侵染和发病起到了推波助澜的作用。因此,土壤湿度对小麦产量有显著的影响,小麦不同生育期对土壤湿度有不同的要求,研究不同土壤水分条件对小麦不同生育期生长、发育和产量形成的影响,以及在不同生育期内小麦适宜水分范围,具有一定的理论价值与实践意义。那么,如何评价湿度对小麦产量的影响呢?下面我们将通过线型混合模型来解决。
最近几年,混合模型理论不断进行扩展应用到多种统计方法中,包括Bayes,岭回归,时间序列,平滑曲线等。不过,在这里我们只讨论其“传统”应用--线性混合模型。JMP Pro 11在拟合模型菜单上有一项新的建模功能,即混合模型。何为混合模型?如何用JMP Pro拟合该模型?混合模型适用于哪些情形?评价湿度对小麦产量的影响的如何通过JMP Pro软件来实现?
何为线性混合模型?
线性混合模型是线性回归模型y=Xβ+ε的推广。一般线性回归模型适用于横断面数据,通过标准最小二乘法来估算固定效应参数,β。将该模型扩展至包含随机效应Z,新的回归模型就变为y=Xβ+Zγ+ε。由于模型中包含固定效应及随机效应,因此称之为混合模型。
为什么要用混合模型?
当响应变量之间存在相关性或者遗漏重要的影响因子时,不考虑这些情况会导致处理因素或其他因素的效应被高估或低估。
混合模型的常见应用如下:
l 随机系数模型允许不同个体之间系数(如截距、斜率)存在差异。个体生长模型就是其中的案例,用于预测个体生长轨迹。
l 用以分析随机区组设计、裂区设计(split-plot design),由于存在easy-to-change和hard-to-change(改变因子需耗掉许多时间或成本)因子,可能会导致多重误差项。
l 以随机效应的形式来把握内在的个体异质性(面板数据模型)。
l 对于重复测量数据,同一个实验对象的测量值存在相关时,即组内误差相关时,适合用混合模型建模。
l 当同一个体测定多个不同值时,响应变量之间存在相关性,此情况下采用混合模型。
l 当研究对象为多层次数据(如研究对象为不同学校里的学生)时,我们称此类模型为分层线性模型或多水平模型。
l 研究空间变异性(空间统计学)。
如何评价种植前土壤湿度对小麦产量的影响?
在本例中,研究目的是为了评价种植前土壤湿度对小麦产量的影响,同时允许不同品种小麦中湿度对产量的效应存在差异。因此,需要构建随机系数模型。该实验随机选取10个小麦品种,每一个品种分别种在6块一英亩的土地上。总共收集60个观测值,其中每个品种有6条观测。(数据集,“wheat”,在JMP样本数据集文件夹中可以找到。)
按照上述步骤构建随机系数模型,在固定效应标签栏添加固定效应(如,截距以及湿度效应)。

在随机效应标签栏中,点击嵌套随机系数按钮,指定截距以及湿度效应随机变化,注意JMP中随机系数的协方差结构是无结构的(Unstructured)。

在重复结构标签栏中,选择残差作为模型误差项。

关于这个案例的详细信息在JMP的帮助文档中有说明。接下来我们看一下运行结果。首先,看随机效应协方差参数估计值报告。

截距的方差为18.89,标准误为9.11,因此Z值为2.07(18.89/9.11)。利用JMP公式编辑器中正态分布的公式(或者查阅统计学书中的标准正态分布表),我们可以得出P值等于0.0192,意味着不同小麦品种的基准产量(种植前没有灌溉)存在统计意义上的差异。同样,我们可以得出湿度与截距协方差的P值为0.3777,湿度方差P值为0.0380。尽管协方差为负,但统计上并不显著。α=0.05时,关于湿度对产量的影响不同小麦品种存在显著的不同。
随机系数报告中给出BLUP(最佳线性无偏估计值),即每个种类的截距、湿度效应与总体效应(固定效应参数估计值)相比的偏移量。对于品种1而言,湿度对产量的影响为0.61(=0.66-0.05),基准产量为34.39(=33.43+0.96),预测方程为产量=34.39+0.61*湿度。
结合固定效应以及随机效应的估计值,我们可以看出湿度对小麦产量存在显著性的影响,同时对于不同种类小麦而言湿度效应存在显著性的差异。随机系数模型为每个小麦品种都提供了一个BLUP(最佳无偏估计)的预测方程。
随机系数模型的其他说明
个体生长模型是一个典型的随机系数模型,需要估算每个个体的随机时间效应。添加时间变量(如天、月等)作为随机效应变量,点击嵌套随机系数按钮后,每个个体可以获得单独的斜率和截距。
在教育研究中,个体经常嵌套在层次结构中,通过添加多个随机效应项,拟合多层次线性结构/多水平模型。