全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
8205 9
2016-08-03
如下图:我最后要使用的变量是Total,Total=Score1+Score2+Score3+Score4
问题是:每个Score里面很容易就出现缺失值,导致也成为Total缺失值,这种情况应该怎么处理?
Total是研究的因变量。如果不做出任何处理,导致模型最后的有效数量只有200多observation。但是如果做出处理,比如用0替代“.”,那么是不是篡改了数据本身的值?
感觉很困惑,请教论坛里的大神们~~~~~ QQ图片20160803170407.png

附件列表
QQ图片20160803102722.png

原图尺寸 15.61 KB

QQ图片20160803102722.png

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-8-3 10:40:34
PS:0在这个研究背景中是有意义的,表示这个人完全没有健康问题。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-8-3 15:41:11
如果score1\2\3\4..表示是不同期的可加数值的话,应该可以做有效样本的均值,来替代total所要达到的意义。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-8-3 16:14:02
egen mean_egen = rmean(score1-score5)
list
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-8-3 16:52:44
lorson 发表于 2016-8-3 15:41
如果score1\2\3\4..表示是不同期的可加数值的话,应该可以做有效样本的均值,来替代total所要达到的意义。
我在想,用均值法更好,还是我用最近某年的值去替代?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-8-3 16:53:09
Howard7738 发表于 2016-8-3 16:14
egen mean_egen = rmean(score1-score5)
list
我换了一下数据的排列形式,请再帮忙看看~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群