全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
4804 8
2017-04-19
求助大神!我在使用merge进行两个表的一对一合并时,检查合并后的数据,发现数据匹配混乱,是什么原因导致的呢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-4-19 16:06:53
这样问应该是没人可以回答的!show 一部份原始资料与合并后之结果来看看(包括你执行之指令)!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-4-19 16:27:51
恩恩,好的!
这是合并前的表1:
   S                 y                  roa            zcfzl             growth                   fss                       lnzzc
000002        2009         0.046727        0.670017        0.192458921        0.1473        25.64767893
000002        2010                0.040993        0.746861        0.037495914        0.1473        26.09686483
000002        2011         0.03916        0.770997        0.415446636        0.1473        26.41432923
000002        2012         0.041348        0.783163        0.436504506        0.1472        26.66027846
000002        2013                0.038183        0.77997        0.31326342        0.147        26.89539499
000002        2014                0.037937        0.772046        0.081002148        0.1491        26.9545516
000002        2015          0.04245        0.777015        0.335827547        0.1523        27.13884642
000002        2016         0.034129        0.805367        0.229753543        0.1524        27.44550351
000003        2001         0.009506        1.819934        -0.921229104        0.0748        20.91549013
000004        2001         0.05787        0.460723        -0.526860106        0.3794        19.2182276
000004        2002        0.031154        0.529541        0.955741878        0.3794        19.38999877
000004        2003        0.032123        0.46014        -0.013946384        0.3794        19.28725654
000004        2004        -0.015321        0.427696        -0.106974586        0.3794        19.18274862
000004        2005        -0.119186        0.358844        -0.42503029        0.3794        18.864525
000004        2006        0.014954        0.450415        -0.256411975        0.2844        19.13512276
000004        2007        -0.058897        0.424184        -0.113706621        0.2596        18.95026489
以下是合并前的表2:
S                  y             Nindcd               am                    rm
000001        2015         I01        0.001511451        0.108694255
000002        2002                J01        0.000335924        0.137313213
000002        2003          J01        -0.003105392        0.256767733
000002        2004         J01        -0.00172313        0.037977105
000002        2005         J01        0.000234577        0.152923116
000002        2006                J01        -0.006281396        0.526033547
000002        2007           J01        0.00294626        0.516344937
000002        2008        J01        -0.002294044        0.102030461
000002        2009        J01        0.001045075        0.043274796
000002        2010        J01        -0.000760919        0.281603046
000002        2011        J01        -0.001829392        0.34723304
000002        2012        J01        0.000275178        0.144835414
000002        2013        J01        0.000624486        0.202197431
000002        2014        J01        0.000123885        -0.003558721
000002        2015        J01        -0.000672665        0.130290415
000002        2016        J01        0.00044909        0.167046834
000004        2002        C81        -0.429394994        -0.781912947
000004        2003        C81        0.188709927        -0.78105012
000004        2004        C81        -0.206696263        -0.744056541
000004        2005        C81        -0.042770936        -0.900639601
000004        2006        C81        -0.461194471        -0.786521167

我是用的命令以及结果是这样的:

merge 1:1 S y using "D:\迅雷下载\新数据2017.4.14\控制变量4.18\2.dta"
(label S already defined)

    Result                           # of obs.
    -----------------------------------------
    not matched                        14,070
        from master                     6,181  (_merge==1)
        from using                      7,889  (_merge==2)

    matched                            14,203  (_merge==3)
    -----------------------------------------
合并之后的表一部分是这样的,这部分就是混乱的一部分:
S                   y          Nindcd        am                     rm              roa  zcfzl    growth   fss  lnzzc           _merge
000004        2002 C81        -0.429394994        -0.781912947                                                master only (1)
000004        2003        C81        0.188709927        -0.78105012                                                master only (1)
000004        2004        C81        -0.206696263        -0.744056541                                                master only (1)
000004        2005        C81        -0.042770936        -0.900639601                                                master only (1)
000004        2006        C81        -0.461194471        -0.786521167                                                master only (1)
000004        2007        C81        0.045355371        -0.661239773                                                master only (1)
做了很多次尝试,也找别的同学做了,但都是这样的结果,希望有大神可以帮忙解答!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-4-19 17:44:08
jijieweiliang 发表于 2017-4-19 16:27
恩恩,好的!
这是合并前的表1:
   S                 y                  roa            zcfzl             growth          ...
你要用回复我会收到通知!此外,你的情况的确看起来有一点特殊,请用 dataex (先 ssc install dataex 并见说明) 将上述资料印出,我才能实验一下。否则,请将两个档寄给我 river@mail.tku.edu.tw,我来试试看!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-4-19 18:16:18
你只需要把没有数据的s,y列单独保存,上传到网站就可以了
这样就知道为什么匹配不上了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-4-19 18:21:15
黃河泉 发表于 2017-4-19 17:44
你要用回复我会收到通知!此外,你的情况的确看起来有一点特殊,请用 dataex (先 ssc install dataex 并见 ...
恩恩,好的,我已将两个表发给您了,麻烦您看看是什么情况吧,谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群