全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
6409 9
2022-03-26
悬赏 50 个论坛币 已解决
本人最近在清洗CHNS数据库,看到了这么庞大的数据(而且还是英文)有点无从下手,在初步的观察数据之后发现,CHNS数据库有大量的缺失值,而且我在处理ID那一块数据的时候就犯难了,对于rst_12和surveys_pud_12这两组数据存在以下疑问,首先是为什么两个数据集个人id的数量不同,再次是为什么每次调查的人数统计也不相同。有大佬能救救我这个可怜的孩子吗?分享一下处理CHNS数据库的经验。万分感谢!
微信截图_20220326095753.png

原图尺寸 120.01 KB

微信截图_20220326095753.png

微信截图_20220326095804.png

原图尺寸 103.08 KB

微信截图_20220326095804.png

微信截图_20220326095823.png

原图尺寸 35.29 KB

微信截图_20220326095823.png

微信截图_20220326095835.png

原图尺寸 102.9 KB

微信截图_20220326095835.png

最佳答案

biochemstone 查看完整内容

每次调查的数量不同是因为每次调查的人员并不完全相同。不同数据集数量不同,与采集数据有关。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-3-26 10:01:03
每次调查的数量不同是因为每次调查的人员并不完全相同。不同数据集数量不同,与采集数据有关。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-3-26 11:02:22
再问大家一下,CHNS中用于合并的唯一标识是什么呀?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-10 19:47:44
chaoqiuyuan9 发表于 2022-3-26 11:02
再问大家一下,CHNS中用于合并的唯一标识是什么呀?
IDIND是合并标识
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-24 18:06:04
biochemstone 发表于 2022-4-10 19:49
每次调查的数量不同是因为每次调查的人员并不完全相同。不同数据集数量不同,与采集数据有关。
好的,已经明白啦,谢谢大佬~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-7-3 21:49:28
chaoqiuyuan9 发表于 2022-3-26 11:02
再问大家一下,CHNS中用于合并的唯一标识是什么呀?
就是每个人的id
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群