全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
12338 6
2014-07-25
正在收集上市公司专利的数据,专利数据库中的公司名称可能会与上市公司的名称有所差别,比如,一个是“某某股份有限公司”一个是“某某有限公司”,即上市前后名称可能不同,如何用stata进行模糊匹配?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-7-25 15:41:23
将两个数据集中公司名称中的“有限公司”或“股份有限公司”统统删除后再merge。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-7-25 16:04:31
voodoo 发表于 2014-7-25 15:41
将两个数据集中公司名称中的“有限公司”或“股份有限公司”统统删除后再merge。
谢谢,这真是一个简单粗暴的好办法!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-7-25 16:39:06
voodoo 发表于 2014-7-25 15:41
将两个数据集中公司名称中的“有限公司”或“股份有限公司”统统删除后再merge。
老师,还要请教您,如何把“有限公司”或“股份有限公司”都删掉呢?substr()这个命令无法做,用abbrev()截出来有乱码。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-7-25 16:46:26
gen xxx = subinstr(x, "股份有限公司",  "", .)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-7-25 16:50:58
voodoo 发表于 2014-7-25 16:46
gen xxx = subinstr(x, "股份有限公司",  "", .)
非常感谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群