m:m merge的原理 - Stata专版 - 经管之家

› 论坛 › 计量经济学与统计论坛五区 › 计量经济学与统计软件 › Stata专版

m:m merge的原理

7709

3

收藏 2017-06-19

在使用m:m merge命令后，想要在合并过的数据库中keep if v1=v2（v1来自master库，v2来自using库），发现每次keep的样本数量都不等。

于是回到原来的库中想探究一下m:m merge的原理，是不是这样的：在保证master库中kervar个数不变的情况下，随机匹配上using库中相同keyvar的样本？

是个小问题，但想和了解的人确定一下。之前一直没太在意，这次才发现这个小现象。

非常感谢！

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

2017-6-19 10:51:33

提醒一下：有 99% 以上之情况是不应该用 m:m 的（错的机会很高）。

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2017-6-19 10:57:55

黃河泉发表于 2017-6-19 10:51
提醒一下：有 99% 以上之情况是不应该用 m:m 的（错的机会很高）。

是的，如果原理是像我说的有一定随机成分的话，那就不敢用了，造成误差的几率还是挺高的。

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-2-24 01:00:04

黃河泉发表于 2017-6-19 10:51
提醒一下：有 99% 以上之情况是不应该用 m:m 的（错的机会很高）。

请问老师为啥错的机会很高呢，感觉只是合并结果中有很多无法一一对应的样本，谢谢老师。

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

相关推荐

栏目导航

热门文章

推荐文章

扫码加好友，拉您进群

各岗位、行业、专业交流群