全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
4441 4
2013-02-17
各位好,我要用stata把不同的表合并起来,在合并过程当中,我发现本来一万多条数据,合并结果_merge(3)的情况比一万多条数据还多然后我就尝试duplicates drop,竟然会有重复数据被删除,请问在合并过程中,为什么会出现自动复制的情况呢?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-3-5 00:04:51
这个问题,我也遇到了。可能stata的merge应该是采用并集,默认缺失的变量值用上一年代替。我建议可以先对文件进行筛选,使其变成一致。但是筛选好像很麻烦,我也不会用。亲,你这个问题是怎么解决的?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-3-5 02:54:31
1、没有你的数据,如果不想让别人用你的数据,那么可以只提供两个数据库的merge的那个变量
2、不清楚你用的merge命令怎么写的,只是说一个结果怎么判断问题出在那里
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-3-5 11:00:50
sunzhimeng 发表于 2013-3-5 00:04
这个问题,我也遇到了。可能stata的merge应该是采用并集,默认缺失的变量值用上一年代替。我建议可以先对文 ...
后来我检测过了,原来是我的using data里面有部分重复的数据,我当时直接从数据库下载,就认为不存在重复问题所以没有进行重复值删除的步骤,后来试了一下,然后结果就正常了。亲,你可以试下
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-3-5 11:04:53
蓝色 发表于 2013-3-5 02:54
1、没有你的数据,如果不想让别人用你的数据,那么可以只提供两个数据库的merge的那个变量
2、不清楚你用的 ...
嗯嗯~我的using data里面存在了重复值,merger语句是正确的,问题也解决了,谢谢哦^_^
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群