全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
1756 3
2013-05-22
一、数据资料如下:(y=0是卒中未并发上消化道出血,y=1是卒中并发上消化道出血)
  

id

  

y

性别

年龄

吸烟史

饮酒史

胃病史

高血压

糖尿病

意识

卒中类型

病变部位

1

1

1

79

0

1

1

1

1

4

1

2

2

1

1

70

0

1

1

1

1

4

1

1

3

1

1

66

1

1

1

1

1

3

1

3

4

1

1

50

0

1

1

1

1

1

1

2














一共有82例样本量。

二、目的
想通过Logistic回归,预测脑卒中并发上消化道出血的风险因素有哪些。
三、问题:
我的操作步骤,如下:
第一步:



第二步:





结果如下:






0




0



我想请问下:画红圈的那些P值为什么都这么大,是说明这些变量都不能预测脑卒中并发上消化道出血的风险吗?
还是说我的方法有问题?
我在网上查了后,得知可能出现这种情况的两个原因:1、样本量不够大(我82例样本量不知道是否不够大)2、某两个因素间存在较强的相关性(但我觉得我的这些因素间应该没有很强的相关性啊)
或者说在第二步选择协变量的时候,需要一个一个的选,然后一个一个的做?
或者说我的方法根本就不对?
还请大神指教,谢谢!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-5-22 13:37:49
一般而言,需要先做单因素的logistic回归,P<0.1的变量再选入进行多因素的回归。这样的话可能避免自变量过多而样本量不够的情况。另一方面,有一种说法,样本量至少需要是自变量的10-15倍。  仅供参考!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-5-22 13:41:11
zyq7547182 发表于 2013-5-22 13:37
一般而言,需要先做单因素的logistic回归,P
如果说是样本量不够,我人为的扩大了样本量(即原始数据复制粘贴一次,样本量扩大为164例,因素有9个),达到10-15倍后,结果仍然如此,该如何解释呢?
另,单因素的Logistic回归,除了吸烟史p>0.1之外,其他的因素都是P<0.001,但是一旦在选择协变量的时候全部选进去,那出来的结果都是这样,求解!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-5-22 16:00:25
几种可能供参考:
1、样本不够
2、重要因子未在所列因子中
3、数据处理不太合适
单因子只能反映数据的关系,需要你专业知识做最终评判。如一楼所说,筛选下,然后再将因子的水平分成两水平进行分析试试。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群