全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
880 1
2016-05-21
悬赏 10 个论坛币 未解决
各位大神,我现在需要将两次考试的成绩合并起来。我的masterdata是test1,里面有变量name,school,grade,yuwen1,math1,totalscore1,usingdata是test2,里面的变量有name,school,grade,yuwen2,math2,totalscore2.我想根据name,school,grade来匹配两个数据库,那么首先我要先删除里面的重复数据,问题来了,比如说一个学校的同年级里面有2个重名的学生例如都叫“张三”,第一次考试成绩分别为“张三A”180分和“张三B”190分,第二次考试成绩分别为“张三C”160分和“张三d”170分。我使用duplicates drop 命令时只会随机删除其中的一个张三,如果张三A和张三C是同一个人,那么我怎么确定用duplicates drop这个命令删除的就一定是张三A和张三C?那么假如最后的成绩是张三A和张三D合在一起的话,那不就错了。为了避免这样的情况我是否需要将张三全部删除,而不能是使用duplicates drop?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-5-21 19:03:34
在搜集数据之前就应该把相同样本的名字做标记处理,以便区分。如果两个表格的都是按照同一个顺序填写的,可以考虑重新生活生成一个变量,用数字将各个样本区分开来,然后再一起合并。如果表格是按照乱序排列的,我觉得应该把相同名字的学生都给去除掉
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群