用stata进行模糊匹配

zhonghuijie

12429

收藏 2014-07-25

正在收集上市公司专利的数据，专利数据库中的公司名称可能会与上市公司的名称有所差别，比如，一个是“某某股份有限公司”一个是“某某有限公司”，即上市前后名称可能不同，如何用stata进行模糊匹配？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

voodoo

2014-7-25 15:41:23

将两个数据集中公司名称中的“有限公司”或“股份有限公司”统统删除后再merge。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

zhonghuijie

2014-7-25 16:04:31

voodoo 发表于 2014-7-25 15:41
将两个数据集中公司名称中的“有限公司”或“股份有限公司”统统删除后再merge。

谢谢，这真是一个简单粗暴的好办法！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

zhonghuijie

2014-7-25 16:39:06

voodoo 发表于 2014-7-25 15:41
将两个数据集中公司名称中的“有限公司”或“股份有限公司”统统删除后再merge。

老师，还要请教您，如何把“有限公司”或“股份有限公司”都删掉呢？substr()这个命令无法做，用abbrev（）截出来有乱码。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

voodoo

2014-7-25 16:46:26

gen xxx = subinstr(x, "股份有限公司", "", .)

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

zhonghuijie

2014-7-25 16:50:58

voodoo 发表于 2014-7-25 16:46
gen xxx = subinstr(x, "股份有限公司", "", .)

非常感谢！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群