
小弟在做论文遇到问题无法处理,请各位路过的大哥大姐帮忙指点一下啊
我是想找出对某一事情Y是否发生的特征因子X1、X2、X3、X4、X5...出来,建立解释方程。
1、首先二项LOGISTIC回归对样本量有什么要求吗?我的数据中样本是80个,Y是否发生的数量是10-25/80,发生的人数范围是10-25个,X1、X2、X3..等自变量是是否出现该特征,取0、1的类型变量。
2、LOGISTIC回归统计中,是把因变量全部进入逐步回归还是应该把变量分类引入统计好呢?
粗略可以把因变量分成两类,X1-X15是第一类,第一类是描述性的,每个数据都判断的,X15-X45是第二类,是特征性的,就是有没有出现这个特征。结果是第一类数据各个因子发生的几率很大,而第二类数据各个因子发生几率很小。这对做回归统计有没有什么影响呢?
是应该分类引入回归统计还是一起呢? 我发现把他们分别引入统计和一起全部引入统计得出来的数据结果不一样,差异很大。如果分类的话得出的是两个解释方程,又该如何处理呢?
请路过的朋友发表下大家的想法,想必对我又帮助的?
最好有高手指点指点,先在此谢谢!