全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
3620 14
2017-06-22
悬赏 2000 个论坛币 已解决
各位坛友好!

我目前正在处理一套企业数据,里面包含企业地址信息,这些地址可能包含有地级市的名字,另外我还有全国地级市的名单,我的想法是如果企业地址中包含某个地级市的名称,就生成一个city 变量并把这个变量命名为这个地级市的名字。但是由于数据量太大,手动无法完成所以想通过stata实现,我也知道strmatch 和strpos 命令吗,但是网上说的不太符合我的情况,所以请各位帮忙一下怎么实现,提前谢谢大家!
补充一下,我不想把所有地级市名称都写在程序中,有没有便捷的方法把这两个数据库link起来来简化程序?




] 1.PNG 2.PNG

最佳答案

逍遥梦蝶 查看完整内容

只是一个简单的模拟,真实数据可能存在这样或那样更多地问题,但是编程的思想是一样的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-6-22 23:12:03
复制代码
只是一个简单的模拟,真实数据可能存在这样或那样更多地问题,但是编程的思想是一样的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-6-22 23:27:32
你这个最后多半都要手动处理一下的。不可能完全自动化的,也没啥必要。
首先把第二个图里的市字都去掉。然后用strpos什么的在第一个图的数据里对每个市生成一个dummy variable。然后把这些dummy加总。然后手动处理和不是1的那些观测值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-6-22 23:39:50
夏目贵志 发表于 2017-6-22 23:27
你这个最后多半都要手动处理一下的。不可能完全自动化的,也没啥必要。
首先把第二个图里的市字都去掉。然 ...
这样啊,这样太麻烦了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-6-23 00:07:58
我爱敏敏 发表于 2017-6-22 23:39
这样啊,这样太麻烦了
。。。比如你图里第一个企业,名字里就有两个市一个镇。你能确保他只和你第二个图里的一个名字对应上么?如果你能确保,那最后可能就不用手动处理。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-6-23 00:11:16
夏目贵志 发表于 2017-6-23 00:07
。。。比如你图里第一个企业,名字里就有两个市一个镇。你能确保他只和你第二个图里的一个名字对应上么? ...
是的,只能与一个名字对上,因为另一个名字不是出现在地级市名单中
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群