全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
2946 5
2009-02-06
<p>想把两个file A和B用firm name这个变量merge起来:</p><p>clear<br/>version 10<br/>set mem 400m<br/>set matsize 500<br/>set more off</p><p>use "H:\A.dta", clear<br/>sort firm name</p><p>merge firm name using "H:\B"</p><p>tab _merge后显示</p><p><br/>     _merge |      Freq.     Percent        Cum.<br/>------------+-----------------------------------<br/>          1 |         11        0.10        0.10<br/>          2 |         19        0.17        0.27<br/>          3 |     11,203       99.73      100.00<br/>------------+-----------------------------------<br/>      Total |     11,233      100.00<br/></p><p><strong>实际上应该是11214个数据,我检查过很多遍,两个file的firm name是完全一致的,</strong></p><p><strong>虽然有重复,但A和B也是用一样多个的变量排序的(sort firm name a b c d, stable),</strong></p><p><strong>可是却有11个“1”的_merger, 为什么会出现这个问题呢?请大家帮助,谢谢!!!</strong></p><p></p>
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2009-2-6 17:38:00

估计还是你的firm name对不上的

11+11203=11214

说明B数据中有19个名称在A中没有

你查查那19个的名称就知道了

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-2-7 02:00:00
stata有command能够核对firm name的么?因为11214个数据,一个个看不见的能都找到耶~ 谢谢!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-2-7 10:27:00
以下是引用iloneonone在2009-2-7 2:00:00的发言:stata有command能够核对firm name的么?因为11214个数据,一个个看不见的能都找到耶

考察变量"_merge"的取值即可判断两库在firm name方面的差异。 

"1",仅在master data中出现

"2",仅在using data中出现

"3",在两者中都出现

[此贴子已经被作者于2009-2-7 10:39:48编辑过]

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-2-7 11:21:00
谢谢!对。我有11个数据是_merge是1的,在知道有11个数据的firm name不符合的基础上,我怎样能知道是哪11个呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-2-7 11:37:00

list firmname if _merge==1|_merge==2

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群