朋友们大家好,我初学STATA,现遇到一个匪夷所思的问题:
我有一个文件包含了81家公司的ISIN,需要通过这些ISIN找到在第二个文件中关于这81家公司对应的信息。
由于第二个文件中,有的公司同时有好几个ISIN码,并用“,”相隔,因此在用1:m merge ISIN指令时出现(note: variable ISIN was str13, now str264 to accommodate using data's values),并发现有些公司的信息没有match到,不知是不是因为merge指令只match第一个ISIN码。
后来我又尝试把有多个ISIN码的情况split成ISIN1,ISIN2,ISIN3...等,想逐次merge各组ISIN码,希望不要有遗漏。可以我逐次merge时,仍然发现有遗漏现象。比如第一家公司US0352901054,merge 1:m ISIN using C:\Users\Vera\Desktop\thesis\org_splitISINsample(note: variable ISIN was str13, now str264 to accommodate using data's values)
Result # of obs.
-----------------------------------------
not matched 58,526
from master 81 (_merge==1)
from using 58,445 (_merge==2)
matched 0 (_merge==3)
-----------------------------------------
说明这家公司找不到对应于第二个文件的ISIN的信息,但我发现明明第二个文件的3824-3835个obs就是这家公司的对应信息。为何会出现这种遗漏现象?如何可以把这81家公司的信息最大化地在第二个文件中合并齐全?请赐教,谢谢大家。