在看王燕、康晓平主编的《卫生统计学教程》中关于协方差的介绍,有些疑问,期望有高手予以指点。
例题:研究某矿区儿童不同铅暴露水平的手指敲击测试结果中,经方差分析证明不同组对铅暴露结果存在影响。但是将年龄作为协变量时,就需要进行协方差分析了。
原始数据如下:
不同组对铅暴露结果的影响
| 对照组 | 暴露组 | 既往暴露组 | 年龄-对照组 | 年龄-暴露组 | 年龄-既往暴露组 | |
| 72 | 54 | 62 | 11 | 10 | 14 | |
| 51 | 57 | 37 | 11 | 10 | 7 | |
| 57 | 48 | 46 | 12 | 9 | 7 | |
| 53 | 41 | 59 | 12 | 6 | 13 | |
| 74 | 34 | 35 | 15 | 5 | 6 | |
| 52 | 54 | 70 | 8 | 12 | 15 | |
| 59 | 38 | 56 | 7 | 6 | 12 | |
| 55 | 49 | 45 | 11 | 7 | 9 | |
| 57 | 58 | 50 | 13 | 12 | 9 | |
| 65 | 40 | 52 | 12 | 6 | 8 | |
| 46 | 51 | 52 | 7 | 8 | 14 | |
| 57 | 44 | 57 | 12 | 11 | 11 | |
| 46 | 52 | 38 | 7 | 13 | 7 | |
| 62 | 42 | 40 | 14 | 9 | 9 | |
| 50 | 55 | 42 | 7 | 8 | 5 | |
| 56 | 44 | | 10 | 6 | | |
54 | 48 | | 9 | 15 | | |
57 | | | 12 | | | |
| 50 | | | 6 | | | |
与协方差有关的假设检验书中列举了4个:
(1)各组回归直线是否平行的假设检验;
(2)各组观测指标的方差是否相等假设检验;
(3)协变量(自变量)与观测指标(因变量)之间是否存在线性关系的假设检验;
(4)在控制协变量的影响后,各组调整的均数是否相等的假设检验。
--------------------------------------------------------------------------------------------
在此之前,本人已经在网上搜索查看了很长时间,也看了不少有关协方差的介绍。但是,在我看来,有不少仅止于第一步,也就是判断下交互作用,然后就没有下文了;也有部分涉及到第二步及第三步的,在判断了交互作用后,P>0.05,说明协变量与因变量之间回归直线的斜率相等后,又进行了方差齐性判断和二次主效应分析。但是至于第四步,在控制协变量的影响后,各组调整的均数是否相等的假设检验。我从来没有见到任何有关的介绍。因次,本人主要的问题就是在于这个地方。
(1)为何要进行均数是否相等的假设检验?
(2)求出调整均数后该怎么做?教材中也仅止于计算了下调整后的均数,从此再也没有了解释,令人很是不解。
-----------------------------------------------------------------------
对上面的问题的spss的操作过程:
由上面结果年龄*性别的P>0.05,可知年龄与性别不存在交互作用,年龄对铅暴露的影响不随分组的不同而不同,回归直线平行,则进行下一步的协方差分析:
协方差分析结果:
绝大多数的教程都到此为止了。并未进行下面的介绍。下面是对均数的调整和参数的估计。
上面就是最终调整后的边际均值了。下面的图是原始的每组的均值。
课本协方差的章节内容到此就结束了。并未进行均值的假设检验。我感到非常疑惑。本来下一步应该进行均数的假设检验,也就是第四步,然后再解释下调整后的均值有什么意义,对整个模型有什么影响,最终应该作出什么样的解释等,但是什么也没有介绍,网上也不容易找到合适的解释。
附数本上的2页: