全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 JMP论坛
2592 2
2014-08-01

在未来几十年内,受大气二氧化碳含量增加产生的温室效应等诸多因素的影响,全球气候变化将给我国小麦生长带来不利影响,北部和西南各冬麦区干旱进一步加剧,而长江中下游冬麦区湿害加重。去年,全国农技中心组织相关专家开展了2013年我国小麦条锈病秋苗考察,结果显示甘肃省、青海省秋苗发病普遍,病田率在80%以上,加之近期土壤湿度大,雨水偏多,这些因素也对条锈病的侵染和发病起到了推波助澜的作用。因此,土壤湿度对小麦产量有显著的影响,小麦不同生育期对土壤湿度有不同的要求,研究不同土壤水分条件对小麦不同生育期生长、发育和产量形成的影响,以及在不同生育期内小麦适宜水分范围,具有一定的理论价值与实践意义。那么,如何评价湿度对小麦产量的影响呢?下面我们将通过线型混合模型来解决。


最近几年,混合模型理论不断进行扩展应用到多种统计方法中,包括Bayes,岭回归,时间序列,平滑曲线等。不过,在这里我们只讨论其“传统”应用--线性混合模型。JMP Pro 11在拟合模型菜单上有一项新的建模功能,即混合模型。何为混合模型?如何用JMP Pro拟合该模型?混合模型适用于哪些情形?评价湿度对小麦产量的影响的如何通过JMP Pro软件来实现?


何为线性混合模型?


线性混合模型是线性回归模型y=Xβ+ε的推广一般线性回归模型适用于横断面数据,通过标准最小二乘法来估算固定效应参数,β。将该模型扩展至包含随机效应Z,新的回归模型就变为y=Xβ+Zγ+ε由于模型中包含固定效应及随机效应,因此称之为混合模型。


为什么要用混合模型?


当响应变量之间存在相关性或者遗漏重要的影响因子时,不考虑这些情况会导致处理因素或其他因素的效应被高估或低估。


混合模型的常见应用如下:

l  随机系数模型允许不同个体之间系数(如截距、斜率)存在差异。个体生长模型就是其中的案例,用于预测个体生长轨迹。

l  用以分析随机区组设计、裂区设计(split-plot design),由于存在easy-to-change和hard-to-change(改变因子需耗掉许多时间或成本)因子,可能会导致多重误差项。

l  以随机效应的形式来把握内在的个体异质性(面板数据模型)。

l  对于重复测量数据,同一个实验对象的测量值存在相关时,即组内误差相关时,适合用混合模型建模。

l 当同一个体测定多个不同值时,响应变量之间存在相关性,此情况下采用混合模型。

l  当研究对象为多层次数据(如研究对象为不同学校里的学生)时,我们称此类模型为分层线性模型或多水平模型。

l  研究空间变异性(空间统计学)。



如何评价种植前土壤湿度对小麦产量的影响?

在本例中,研究目的是为了评价种植前土壤湿度对小麦产量的影响,同时允许不同品种小麦中湿度对产量的效应存在差异。因此,需要构建随机系数模型。该实验随机选取10个小麦品种,每一个品种分别种在6块一英亩的土地上。总共收集60个观测值,其中每个品种有6条观测。(数据集,“wheat”,在JMP样本数据集文件夹中可以找到。)


按照上述步骤构建随机系数模型,在固定效应标签栏添加固定效应(如,截距以及湿度效应)。


                              


在随机效应标签栏中,点击嵌套随机系数按钮,指定截距以及湿度效应随机变化,注意JMP中随机系数的协方差结构是无结构的(Unstructured)。




在重复结构标签栏中,选择残差作为模型误差项。




关于这个案例的详细信息在JMP的帮助文档中有说明。接下来我们看一下运行结果。首先,看随机效应协方差参数估计值报告。



截距的方差为18.89,标准误为9.11,因此Z值为2.0718.89/9.11)。利用JMP公式编辑器中正态分布的公式(或者查阅统计学书中的标准正态分布表),我们可以得出P值等于0.0192,意味着不同小麦品种的基准产量(种植前没有灌溉)存在统计意义上的差异。同样,我们可以得出湿度与截距协方差的P值为0.3777,湿度方差P值为0.0380。尽管协方差为负,但统计上并不显著。α=0.05时,关于湿度对产量的影响不同小麦品种存在显著的不同。


随机系数报告中给出BLUP(最佳线性无偏估计值),即每个种类的截距、湿度效应与总体效应(固定效应参数估计值)相比的偏移量。对于品种1而言,湿度对产量的影响为0.61=0.66-0.05),基准产量为34.39=33.43+0.96),预测方程为产量=34.39+0.61*湿度


结合固定效应以及随机效应的估计值,我们可以看出湿度对小麦产量存在显著性的影响,同时对于不同种类小麦而言湿度效应存在显著性的差异。随机系数模型为每个小麦品种都提供了一个BLUP(最佳无偏估计)的预测方程。


随机系数模型的其他说明

个体生长模型是一个典型的随机系数模型,需要估算每个个体的随机时间效应。添加时间变量(如天、月等)作为随机效应变量,点击嵌套随机系数按钮后,每个个体可以获得单独的斜率和截距。

在教育研究中,个体经常嵌套在层次结构中,通过添加多个随机效应项,拟合多层次线性结构/多水平模型。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-8-1 19:53:45
好高端的样子,,不明觉厉。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-8-4 11:47:49
yuye001 发表于 2014-8-1 19:53
好高端的样子,,不明觉厉。
其实线性混合模型不仅仅用在这一方面,其他领域也可以用的,这里只是一个案例,期待更多不同领域的应用。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群