全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
2073 3
2010-12-07
我的数据是19个自变量,有连续的也有定性的。因变量是一个二分定性变量。我想用logistic回归做 用R软件  第一种方法是我把所有变量都放到模型,然后step程序,根据AIC判断,最后剩7个变量。
  另一种方法是我把每个变量分别单独回归,把显著的挑出来放在一起再step最后剩4个变量。
  不知道哪种方法可取,而且step之后的模型就是最后的模型了吗?之前或之后还用做什么别的处理吗?
   有的自变量是3分类的变量,可能其中就只有2类是显著的,如果这样我要怎么办呢?


这个数据马上要交了,特别急,我又是新接触的统计,希望各位明白人能给予指导,感激不尽!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-12-7 14:27:12
个人觉得用STEP的结果可能更为合理一些吧,因为毕竟你的regressor之间可能会存在关联
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-12-7 14:35:20
没有什么方法保证一定行的,step并不是完美的方法,而且也要看你是如何设定的。你做出的结果可以满足你的需要就可以了。 lz可以试着用lasso+cross validation跑一下,看看结果如何。不过其实一般step后的结果就可以了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-5-30 09:47:53
謝謝樓主的分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群