全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
7660 5
2012-03-04
例如有一列变量为公司名字
北京市某某公司
希望提取 某某, 我写的code是
gen name2=regexs(1) if (regexm(firmname, ".市([][])"))
但是好像不work
请教大家怎么办才好?谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-3-4 11:02:42
贴出一部分数据
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-3-4 20:30:10
firmname
北京市九达纺织集团公司
北京市九达纺织集团进出口公司
中华书局对外图书贸易部
北京市图书进出口有限公司
北京协和医药科技开发总公司
文物出版社
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-3-4 20:52:15
*试一下
g firm=cond(strpos(firmname,"北京市"),substr(firmname,strpos(firmname,"北京市")+6,.),firmname)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-3-7 16:38:23
sungmoo 发表于 2012-3-4 20:52
*试一下
g firm=cond(strpos(firmname,"北京市"),substr(firmname,strpos(firmname,"北京市")+6,.),firmna ...
*看手册发现一个更优化的方法,直接用ends()函数
egen x=ends(firmname),punct("北京市") trim last
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-3-7 16:53:24
aolei 发表于 2012-3-7 16:38
*看手册发现一个更优化的方法,直接用ends()函数
egen x=ends(firmname),punct("北京市") trim last
这是一个好方法。

不过,不能专门提取"北京市"后的两个字符。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群