全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
10676 7
2010-06-12
用merge命令在stata里面匹配数据时出现一个问题:
    key variable形式如:00233X  ch2334   即:数字和字母同时出现, 两组数据中key variable  a5_0形式都是string。
   将两组数据匹配的时候总是显示这样的话(其中a5_0是key variable ):
     variable a5_0 does not uniquely identify observations in the master data
     variable a5_0 does not uniquely identify observations in the using dta
     但是我很确定key variable在两组数据中都是唯一的,所以我怀疑是不是因为关键变量的形式比较特殊导致出现这样的问题,因为以前用股票代码(纯数字形式)匹配的时候从没有出现这样的问题,但是将变量改成数值格式(Long)后虽然显示能成功匹配(merge==3),但是实际观察数据时存在存在严重的匹配错误,我也搞不清楚应该怎么解决了,请高人指教!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-6-13 10:02:31
1# 0013133
这。。。最好还是贴些数据出来(例如,20个observations);这样子说,很难看出问题来。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-6-13 15:37:22
key variables 基本上就是这种形式:00233X  ch2334  即:同时存在数字和字母
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-6-13 16:16:01
需要匹配两个数据库的代码公布有没有什么关系啊。
你可以不公布对应的变量
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-6-13 19:54:05
其他的也都差不多
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-6-13 20:14:35
0013133 发表于 2010-6-12 21:40
用merge命令在stata里面匹配数据时出现一个问题:
    key variable形式如:00233X  ch2334   即:数字和字母同时出现, 两组数据中key variable  a5_0形式都是string。
        但是我很确定key variable在两组数据中都是唯一的,所以我怀疑是不是因为关键变量的形式比较特殊导致出现这样的问题,因为以前用股票代码(纯数字形式)匹配的时候从没有出现这样的问题,但是将变量改成文本格式(Long)后虽然显示能成功匹配(merge==3),但是实际观察数据时存在存在严重的匹配错误,我也搞不清楚应该怎么解决了,请高人指教!
请不要用眼睛来检查!也许眼睛告诉你的是错误的.
用duplicates或isid来检测,
duplicates report a5_0
duplicates e a5_0
告诉你什么结果.
如有duplicates,就用duplicates drop a5_0来删掉多余的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群