全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 统计软件培训班VIP答疑区
2666 2
2013-04-26
张老师:
       现由基层单位报上来数据7000多条,需要对其分析。但发现用logistic回归分析的5个重要变量,不是这缺就是那缺,而主要是两个连续性变量的数据缺失,5个变量全有的数据仅4000条。我现在考虑有三个方法:1.只用完整数据,对其logistic回归分析,2.经过little检验,用EM法对缺失数据填补,再用Logistic回归分析。3.对7000条数据的某些变量进行单因素分析,再对完整数据进行Logistic 回归分析。想问你的问题:1.三种办法选择哪种好?2.如果仅对完整数据分析,专家问起来缺失的问题,如何解释回答才好?不是完全随机分析,怎么代表7000条的真实结果(7000条也不是随机抽的,只是按要求体检结果抽出来报送的),谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-4-27 13:29:56
先用单因素方法做预筛,明显无关的就不用再考虑了。
可以做EM的缺失值填补,但是要小心,最好是填补前后的数据都进行建模,看结果是否有很大差异。
对缺失值出现原因的定性分析非常重要。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-5-3 11:58:42
看看能发帖没
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群