全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
4553 26
2012-02-23
各位大侠,

关于回归分析请各位指点指点,有三个变量,如A,B,C作为自变量,其中c是A与B 的交互变量。BP作为因变量。
如果step1
model BP=A    B;
A有统计学意义。

如果step2
model BP=c;
c 有统计学意义。

但如果step3
model BP= A  B  C;
A 和C都没有统计学意义了。

问题1:
如何解释step3的结果。

问题2:
3个regression analysis能说明C与血压的结果全部是由于A对血压有影响吗?

非常感谢!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-2-23 15:40:42
个人认为,是不是因为A与C之间存在自相关呢?

检验方法:

ods graphics on;

proc corr data = xxx plots=matrix;
/*调用corr过程分析数据,并且绘制所有变量之间的散点矩阵图*/
run;

ods graphics off;

/*对相关系数进行分析,比如说correlation coefficients以及P value*/

/*通过以上判断,基本能对自变量之间的共线关系有一个初步的判断,接下来通过reg过程诊断共线性:*/

proc reg data = xxx;
        model a = b c d e
                            f g / vif tol;
/*假设f与g之间发现线性关系*/
/*vif: variance inflation (方差膨胀系数); tol: tolerance (容忍度)*/
run;

/*在输出中,重点观察vif以及tol这两个系数的值。tol表示此自变量不能被其他自变量解释的部分,因此这个值越小,则共线性越强;而vif则为容忍度的倒数,因此它的值约大,则共线性越强*/
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-23 15:50:53
谢谢你,我想你是对的。我试试后再将结果与你分享。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-23 16:22:34
Hi, SUNSET1986,

你是对的,A与C的相关系数是-0.48,P<0.001;

另外回归诊断,其中C的tol最小,var最大。

A与C,B与C都存在共线性。
现在我的问题是如何证明:
C与血压的结果是否全部是由于A对血压有影响?A  与C 有共线性,对step3的结果有什么影响?

因为我写了一篇文章,文章中已列表:
model1 BP= C, C 对血压有影响。
model2 BP=A B,A  对血压有影响。
但编辑非要让我做一个分析
model3 BP=A B C,
让我证明C与血压的结果是否全部是由于A对血压有影响,但model3  A 和 C  对血压都没有影响。我要怎么办才能证明C与血压的结果是否全部是由于A对血压的影响。

非常感谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-23 22:12:11
goodidea 发表于 2012-2-23 16:22
Hi, SUNSET1986,

你是对的,A与C的相关系数是-0.48,P
Hello goodidea

你忘记点回复咯,所以没能及时看到,我先研究研究,晚些时候给你建议,呵呵
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-23 22:40:41
A与C,B与C都存在共线性。
现在我的问题是如何证明:
C与血压的结果是否全部是由于A对血压有影响?A  与C 有共线性,对step3的结果有什么影响?

简单得说,如果a与c以及b与c都存在共线性,那么step3的模型解释度(adjusted R^2)我估计也很低,换句话讲,可以说step3的模型不能够成立,没有实际意义。

因为我写了一篇文章,文章中已列表:
model1 BP= C, C 对血压有影响。
model2 BP=A B,A  对血压有影响。
但编辑非要让我做一个分析
model3 BP=A B C,
让我证明C与血压的结果是否全部是由于A对血压有影响,但model3  A 和 C  对血压都没有影响。我要怎么办才能证明C与血压的结果是否全部是由于A对血压的影响。

第一个帖子中,你提到step3中a与c都没有统计意义,那也就是说b还有统计学意义,那我倒是觉得你不如捆绑a与c,比如说相除,想乘,看下A与C组成的联合变量是否有统计意义,如果有,就要分析一下你现在把这两个变量组合之后代表的什么意义。

而且,试想就算你的model3成功了,那能解释编辑提出的问题么?除非C没有统计意义而a有,现在看来,在model3中c和a都没有统计意义,我想恰恰说明了这两个变量对血压的影响是同时存在互不干扰的,从你的相关系数也看出,这两个变量没有正相关,而是负相关,说明他们的变化方向相反。所以,我想编辑想要的结果可能得不到


最后,你给我一个sas输出我看看那些系数,以及model1,2,3的参数,谢谢咯
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群