根据张文彤《 SPSS.11-0统计分析教程 (高级篇) 第5章中关于Logistic回归模型的样本量,有论述如下:
首先选择应变量较少的那一类,然后将该数值除以10,这就是模型中可以分析的自变量数。例如有100条记录,其中结局为患病的70条,30条为未患病,则模型中可分析的自变量数为30/10=3.如果希望分析四个自变量,请增加样本量。
按照上面说法,我的视力筛查样本资料,71例中,正常的19例,异常的52例,则模型中分析自变量数应为19/10=1.9 。只能分析1个(或四舍五入2个?)自变量?而我的样本自变量却有16个。如果要把16个用起来的话,则样本需要160正常的,即160/10=16,而异常的也要起码161以上,总样本不能少与321例。
——这样的理解是否正确呢?
而SPSS10.0教程中的引例肾癌标本资料总26例,有转移的9个,按上述说法9/10=0.9,自变量1个都不可以?显然它却有5个自变量。
请问高手:这如何解释?如何解释Logistic回归模型的样本量要求?