全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
2450 3
2009-07-11
小弟在做论文遇到问题无法处理,请各位路过的大哥大姐帮忙指点一下啊
我是想找出对某一事情Y是否发生的特征因子X1、X2、X3、X4、X5...出来,建立解释方程。
1、首先二项LOGISTIC回归对样本量有什么要求吗?我的数据中样本是80个,Y是否发生的数量是10-25/80,发生的人数范围是10-25个,X1、X2、X3..等自变量是是否出现该特征,取0、1的类型变量。

2、LOGISTIC回归统计中,是把因变量全部进入逐步回归还是应该把变量分类引入统计好呢?
      粗略可以把因变量分成两类,X1-X15是第一类,第一类是描述性的,每个数据都判断的,X15-X45是第二类,是特征性的,就是有没有出现这个特征。结果是第一类数据各个因子发生的几率很大,而第二类数据各个因子发生几率很小。这对做回归统计有没有什么影响呢?
      是应该分类引入回归统计还是一起呢? 我发现把他们分别引入统计和一起全部引入统计得出来的数据结果不一样,差异很大。如果分类的话得出的是两个解释方程,又该如何处理呢?
       请路过的朋友发表下大家的想法,想必对我又帮助的?
       最好有高手指点指点,先在此谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2009-7-13 08:37:07
尽量把你的问题写的简练一些。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-7-18 17:55:16
1、经验上最好超过300,变量太多了,可以消减下,比如主成分下。
2、不要用逐步的,因变量中01比例不要差异太大
3、模型解释看书
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-7-19 14:40:11
推荐看张文彤教授编写的SPSS高级教程,那里有样本的要求。
第一感觉是你的自变量太多了,要分析这么多自变量,需要的样本极多。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群