Logistic回归结果有问题，请教大神！

weiruiwc

1853

收藏 2013-05-22

一、数据资料如下：（y=0是卒中未并发上消化道出血，y=1是卒中并发上消化道出血）

性别

年龄

吸烟史

饮酒史

胃病史

高血压

糖尿病

意识

卒中类型

病变部位

一共有82例样本量。

二、目的
想通过Logistic回归，预测脑卒中并发上消化道出血的风险因素有哪些。
三、问题：
我的操作步骤，如下：
第一步：

第二步：

结果如下：

我想请问下：画红圈的那些P值为什么都这么大，是说明这些变量都不能预测脑卒中并发上消化道出血的风险吗？
还是说我的方法有问题？
我在网上查了后，得知可能出现这种情况的两个原因：1、样本量不够大（我82例样本量不知道是否不够大）2、某两个因素间存在较强的相关性（但我觉得我的这些因素间应该没有很强的相关性啊）
或者说在第二步选择协变量的时候，需要一个一个的选，然后一个一个的做？
或者说我的方法根本就不对？
还请大神指教，谢谢！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

zyq7547182

2013-5-22 13:37:49

一般而言，需要先做单因素的logistic回归，P<0.1的变量再选入进行多因素的回归。这样的话可能避免自变量过多而样本量不够的情况。另一方面，有一种说法，样本量至少需要是自变量的10-15倍。仅供参考！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

weiruiwc

2013-5-22 13:41:11

zyq7547182 发表于 2013-5-22 13:37
一般而言，需要先做单因素的logistic回归，P

如果说是样本量不够，我人为的扩大了样本量（即原始数据复制粘贴一次，样本量扩大为164例，因素有9个），达到10-15倍后，结果仍然如此，该如何解释呢？
另，单因素的Logistic回归，除了吸烟史p>0.1之外，其他的因素都是P<0.001，但是一旦在选择协变量的时候全部选进去，那出来的结果都是这样，求解！！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

abcdefjiii

2013-5-22 16:00:25

几种可能供参考：
1、样本不够
2、重要因子未在所列因子中
3、数据处理不太合适
单因子只能反映数据的关系，需要你专业知识做最终评判。如一楼所说，筛选下，然后再将因子的水平分成两水平进行分析试试。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群