全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
7003 8
2022-07-30
求问各位大神,比如我以A数据为基础,合并B数据。合并完之后会出现merge==1、2、3的三种情况,merge==1是A有B没有,merge==2是A没有B有。对于这种情况,我在数据处理的过程中应该把merge==1和2的都给删除掉吗?第一次处理数据实在不知道怎么办是对的,还请各位帮帮忙。(这里A是总资产基础数据、B是自变量数据,后续还会合并因变量和控制变量的,对于这些应该怎么保留与删除也求各位指点)谢谢!!!

merge==2情况
附件列表
微信图片_20220730225750.jpg

原图尺寸 145.34 KB

merge==1情况

merge==1情况

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-7-31 09:27:31
li-aolin 发表于 2022-7-30 23:07
求问各位大神,比如我以A数据为基础,合并B数据。合并完之后会出现merge==1、2、3的三种情况,merge==1是A有 ...
我一般是保留1和3
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-7-31 09:36:54
917968079 发表于 2022-7-31 09:27
我一般是保留1和3
1的话那些没有的用缺失值处理吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-7-31 09:48:18
li-aolin 发表于 2022-7-31 09:36
1的话那些没有的用缺失值处理吗
等匹配完再处理也不迟,留着也没啥坏处,我一般不会删主数据的内容
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-8-1 15:24:30
同意楼上的说法,如果不是缺失很多的哈,通常保留1与3。而且后期研究可能还会匹配一些新的数据进去,如果无限的剔除主数据内容,那么研究的结论是不稳定的。主数据中如果存在缺失值,按照情况选择不同的方法填补就行了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-8-1 18:33:30
首先,需要看一下,没匹配上的数据是为什么没匹配上,是不是同一个匹配变量的值在两个数据里的格式或者其他写法不同,这种在统一后也是可以匹配上的,能够减少数据损失。比如通过地名匹配两个数据,在其中一个数据集里,有北京,而另一个是北京市,这种直接匹配不上,但在更正某一个数据以后就可以匹配上。
其次,要明确,using的这个文件的变量是不是核心变量,缺了就不行,如果是的话,这时候删不删对后面回归结果影响不大,也是可以删去的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群