[求助]重新简化提问：如何解释Logistic回归模型的样本量要求？

zllfy

6237

收藏 2009-04-27

根据张文彤《 SPSS.11-0统计分析教程（高级篇）第5章中关于Logistic回归模型的样本量，有论述如下：

首先选择应变量较少的那一类，然后将该数值除以10，这就是模型中可以分析的自变量数。例如有100条记录，其中结局为患病的70条，30条为未患病，则模型中可分析的自变量数为30/10=3.如果希望分析四个自变量，请增加样本量。

按照上面说法，我的视力筛查样本资料，71例中，正常的19例，异常的52例，则模型中分析自变量数应为19/10=1.9 。只能分析1个（或四舍五入2个？）自变量？而我的样本自变量却有16个。如果要把16个用起来的话，则样本需要160正常的，即160/10=16，而异常的也要起码161以上，总样本不能少与321例。

——这样的理解是否正确呢？

而SPSS10.0教程中的引例肾癌标本资料总26例，有转移的9个，按上述说法9/10=0.9，自变量1个都不可以？显然它却有5个自变量。

请问高手：这如何解释？如何解释Logistic回归模型的样本量要求？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

bandbird

2009-4-27 10:56:00

二、使用羅吉斯迴歸分析時應注意事項
##===============================

## 參考John Spicer (2005): Making Sense of Multivariate Data Analysis,
## p. 134-136

## 一、關於樣本數的大小：基本樣本數要大於100，且每多增加一個自變數，樣
## 本數至少要增加50。依變數類別之間個數差距愈大，所需要的樣本數就愈多。
## 加上因為list-wise deletion會造成許多樣本在進行迴歸分析時流失，因此一
## 般來說有數百個樣本比較能夠確保結果的可信度。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

kuangsir6

2009-4-27 12:36:00

张文彤书上的说法是正确的。

有的书上的案例是编出来的，是为了说明SPSS操作问题的，不一定考虑到这个问题。

[此贴子已经被作者于2009-4-27 12:37:27编辑过]

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

zllfy

2009-4-27 20:17:00

谢谢2楼、3楼楼主！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

henryyhl

2014-6-8 09:24:16

学习了。不知道有没有相关的计算Logistic 回归的文献（不是公式的，就是说应变量最少结局的例数为自变量个数的10倍的出处的）谢谢

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群