全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
7525 3
2017-06-19

在使用m:m merge命令后,想要在合并过的数据库中keep if v1=v2(v1来自master库,v2来自using库),发现每次keep的样本数量都不等。

于是回到原来的库中想探究一下m:m merge的原理,是不是这样的:在保证master库中kervar个数不变的情况下,随机匹配上using库中相同keyvar的样本?

是个小问题,但想和了解的人确定一下。之前一直没太在意,这次才发现这个小现象。

非常感谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-6-19 10:51:33
提醒一下:有 99% 以上之情况是不应该用 m:m 的(错的机会很高)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-6-19 10:57:55
黃河泉 发表于 2017-6-19 10:51
提醒一下:有 99% 以上之情况是不应该用 m:m 的(错的机会很高)。
是的,如果原理是像我说的有一定随机成分的话,那就不敢用了,造成误差的几率还是挺高的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-2-24 01:00:04
黃河泉 发表于 2017-6-19 10:51
提醒一下:有 99% 以上之情况是不应该用 m:m 的(错的机会很高)。
请问老师为啥错的机会很高呢,感觉只是合并结果中有很多无法一一对应的样本,谢谢老师。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群