全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
5557 4
2013-02-20
我之前分析数据时一直用SPSS,后来需要用到bootstrap就接触R语言。我把之前用SPSS分析的数据用R运行了一次,发现了些问题,希望能有人帮忙解答!
我是用COX模型来拟合条件logistic回归,在SPSS里通过一些变量的设置就用COX回归把模型拟合出来了,在R里是通过survival包来实现。问题是这样的:
1.在SPSS中,把所有协变量放入框内后,我选择的变量选入方法为Enter,分析出来的结果与R运行coxph(Y~X1+X2+…+Xn,data=shuju)后结果一致;
2.在SPSS中,我把变量选入方法改为Forward,而在R中对COX模型用了step(cox,direction=c("forwad")),也即同样用Forward方法,但两种软件中的结果不一样,其中SPSS中结果比Enter筛选的变量少,有个别有统计差异变量不是同一变量,R中的结果与没有变量筛选时结果一样,即与第1步中SPSS、R结果一致;
3.这次把变量选入方法改为Backward,SPSS结果与Enter法筛选的变量一样,但统计学差异更显著,R反而筛选出了更多的变量。
在此想让各位帮忙解释为什么有这个差别呢?Enter法时SPSS于R结果一致,而Forward与Backward时彼此又不一样,怎么会这样呢?我该选择哪种软件的结果呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-2-20 10:07:40
这可能是因为两个软件进行变量筛选的时候变量筛选标准不同造成的结果。
使用backward 或者Forward 筛选变量的标准很多,例如最常用的adjusted R square、F值,AIC,BIC,SBC,HQ等。就筛选过程而言,所有软件遵循的法则都是一样的,如Forward都是变量是逐次加入而不剔除,但如何进行变量加入则依赖于筛选指标,F值筛选和AIC筛选的结果就可能有所差异。而一旦进入的变量不同,统计量的结果就有可能会有很大不同。前一个模型变量显著的,而后一个模型变量就不显著,某种程度上说明模型稳健性有一定问题。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-2-21 00:51:59
parazhu 发表于 2013-2-20 10:07
这可能是因为两个软件进行变量筛选的时候变量筛选标准不同造成的结果。
使用backward 或者Forward 筛选变量 ...
谢谢parazhu!
但是我在R中用Backward方法是,最开始AIC值是58.69,变量筛选回归后AIC为180.47,使用Backward方法
是会使AIC变大的吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-2-21 07:57:19
这个看上去倒是有些问题,准则即使使用不同,结果差异不会这么大。你可用第三个软件,如sas进行下验证。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-2-21 22:14:11
谢谢parazhu!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群