全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
1577 1
2010-11-20
数据描述:
200 observations,21 variables  因变量是一个二分变量,自变量既有定性的又有定量的(其中3个是定量的,其余全是定性的),要用 Logistic regression ,具体步骤是做什么呢?  是首先进行主成分分析,找出显著影响的变量吗?




另问:做统计之前,都一定要对数据进行预处理,剔除异常值吗?要是用R软件,有哪些找出异常值的方法呢,我做了箱形图,可是用它去除异常值,就一直去降低不完,因为分位数一直在变,总有异常值存在。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-6-1 16:54:21
主成分是用来降维的,要求自变量间相关度高才会比较好

提出异常值一般可以考虑均值±3sigma
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群