1.体力活动处理:职业相关体力活动方面,自己在做数据时缺失严重,达到一半左右的缺失率,而根据已发表的文献缺失率远远小于此,不知道自己是没有考虑到什么变量。
missing data很常见,但一半左右的缺失率的确还是太高了,建议采用相应的方法填充缺失值,可以参考spss和stata中的相关统计方法。
2.膳食营养素评估:主要面临的问题是只找到2002年的食物成分表,导致有将近400条的食物编码对应的营养素缺失,导致营养素估算缺失值严重。但是这是我能找到的最全的食物成分表了,总共有将近1500个食物条目,不知道处理过的大神是怎么处理这个情况的。
这个应该考虑合并处理,如果1500条食物全部作为变量,首先,统计效能可能会比较低,其次,也没有必要。