sungmoo 发表于 2011-5-13 17:42 
wonway 发表于 2011-5-13 15:36  两组美国数据,在代码不能完全匹配的情况下,想通过公司名称来匹配,如果两个公司有相同的单词就认为他们是同一个公司,比如 Big Apple Com.和 Apple ins.就认为是匹配上的,这个用stata怎么实现呢?
两组美国数据,在代码不能完全匹配的情况下,想通过公司名称来匹配,如果两个公司有相同的单词就认为他们是同一个公司,比如 Big Apple Com.和 Apple ins.就认为是匹配上的,这个用stata怎么实现呢?
"Big Apple inc"、"Apple com"、"Orange com"算不算同一个公司?(传递性问题)
假如现在有两组一一对应的变量,name1 和name2,然后如果两组有相同单词,则认为他们是同一个公司,生成一个新的变量==1 否则为0。
name1                name2
Big Apple inc     Apple com
Small inc           small inc
Orange com      Orange
这样的话就不存在传递性的问题了应该?请问这样可以用stata实现吗?谢谢!!