全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
6454 7
2017-12-06
两个数据集"001"、"002"中都含有ID和areanbs这两个变量,理论上ID所对应的areanbs是固定的。我想把这两个数据集中ID不一致的部分(如"001"中的0102333、"002"中的0102061),以及ID与areanbs对应关系不一致的部分(如0102331)都找出来,能否在stata里实现?部分样本数据如下:
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-12-6 22:37:23
将两个数据文件保存为1.dta,2.dta,然后打开任意一个数据文件
复制代码

或许可以使用merge指令试试,不能匹配上的应该就是有问题的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-12-6 22:52:04
wead456789 发表于 2017-12-6 22:37
将两个数据文件保存为1.dta,2.dta,然后打开任意一个数据文件

或许可以使用merge指令试试,不能匹配上的 ...
谢谢,可是这样操作只能得到"001"有而"002"无,或"002"有而"001"无的观察值,不能得到ID与areanbs对应关系不一致的部分
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-12-6 23:13:57
dazzlingpuck 发表于 2017-12-6 22:52
谢谢,可是这样操作只能得到"001"有而"002"无,或"002"有而"001"无的观察值,不能得到ID与areanbs对应关系 ...
不好意思,没有仔细看,关于重复出现相同观测值的问题,我是这么想的,还是使用1.dta,2.dta
复制代码
您试试这样可以吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-12-6 23:45:50
wead456789 发表于 2017-12-6 23:13
不好意思,没有仔细看,关于重复出现相同观测值的问题,我是这么想的,还是使用1.dta,2.dta您试试这样可以 ...
感谢!把第2行改成duplicates tag ID areanbs,gen(copies)就没问题啦
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-12-7 08:04:08
请试试
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群