全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
6123 4
2009-04-27
根据张文彤《 SPSS.11-0统计分析教程 (高级篇) 第5章中关于Logistic回归模型的样本量,有论述如下:

首先选择应变量较少的那一类,然后将该数值除以10,这就是模型中可以分析的自变量数。例如有100条记录,其中结局为患病的70条,30条为未患病,则模型中可分析的自变量数为30/10=3.如果希望分析四个自变量,请增加样本量。

 

按照上面说法,我的视力筛查样本资料,71例中,正常的19例,异常的52例,则模型中分析自变量数应为19/10=1.9 。只能分析1个(或四舍五入2个?)自变量?而我的样本自变量却有16个。如果要把16个用起来的话,则样本需要160正常的,即160/10=16,而异常的也要起码161以上,总样本不能少与321例。

——这样的理解是否正确呢?

而SPSS10.0教程中的引例肾癌标本资料总26例,有转移的9个,按上述说法9/10=0.9,自变量1个都不可以?显然它却有5个自变量。

 请问高手:这如何解释?如何解释Logistic回归模型的样本量要求?

 

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2009-4-27 10:56:00
二、使用羅吉斯迴歸分析時應注意事項
##===============================

## 參考John Spicer (2005): Making Sense of Multivariate Data Analysis,
## p. 134-136

## 一、關於樣本數的大小:基本樣本數要大於100,且每多增加一個自變數,樣
## 本數至少要增加50。依變數類別之間個數差距愈大,所需要的樣本數就愈多。
## 加上因為list-wise deletion會造成許多樣本在進行迴歸分析時流失,因此一
## 般來說有數百個樣本比較能夠確保結果的可信度。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-4-27 12:36:00

张文彤书上的说法是正确的。

有的书上的案例是编出来的,是为了说明SPSS操作问题的,不一定考虑到这个问题。

[此贴子已经被作者于2009-4-27 12:37:27编辑过]

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-4-27 20:17:00
谢谢2楼、3楼楼主!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-6-8 09:24:16
学习了。不知道有没有相关的计算Logistic 回归的文献(不是公式的,就是说应变量最少结局的例数为自变量个数的10倍的出处的)谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群