全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 悬赏大厅
2399 2
2018-01-29
悬赏 30 个论坛币 未解决
用CHNS数据做2009年横断面营养素摄入与疾病关联性分析方面的课题。现在数据处理遇到以下两个主要问题,求大神给指导:
1.体力活动处理:职业相关体力活动方面,自己在做数据时缺失严重,达到一半左右的缺失率,而根据已发表的文献缺失率远远小于此,不知道自己是没有考虑到什么变量。
2.膳食营养素评估:主要面临的问题是只找到2002年的食物成分表,导致有将近400条的食物编码对应的营养素缺失,导致营养素估算缺失值严重。但是这是我能找到的最全的食物成分表了,总共有将近1500个食物条目,不知道处理过的大神是怎么处理这个情况的。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-2-6 21:35:45
1.体力活动处理:职业相关体力活动方面,自己在做数据时缺失严重,达到一半左右的缺失率,而根据已发表的文献缺失率远远小于此,不知道自己是没有考虑到什么变量。
   
    missing data很常见,但一半左右的缺失率的确还是太高了,建议采用相应的方法填充缺失值,可以参考spss和stata中的相关统计方法。

2.膳食营养素评估:主要面临的问题是只找到2002年的食物成分表,导致有将近400条的食物编码对应的营养素缺失,导致营养素估算缺失值严重。但是这是我能找到的最全的食物成分表了,总共有将近1500个食物条目,不知道处理过的大神是怎么处理这个情况的。

    这个应该考虑合并处理,如果1500条食物全部作为变量,首先,统计效能可能会比较低,其次,也没有必要。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-4-14 22:52:53
您好,看了您在论坛当初提的CHNS体力活动的问题,我现在也遇到了相同的状况,请问您后来怎么解决的呢?谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群