stata提取变量中的中英文、数字 - Stata专版 - 经管之家

› 论坛 › 计量经济学与统计论坛五区 › 计量经济学与统计软件 › Stata专版

stata提取变量中的中英文、数字

3966

2

收藏 2021-06-08

如题，本人比较懒，不喜欢把代码搞长，希望有最短的代码把事儿办了。

尝试用以下正则表达式方法处理：
g new_var = ustrregexs(0) if ustrregexm(var,"[0-9A-Za-z\u4e00-\u9fa5]+")

var为原始变量（第一列），new_var 为提取后的变量（第二列）
但是发现只能提取到第一部分，如果有间断就不成功，如下图

QQ截图20210608095642.png

QQ截图20210608095616.png

当然，数据中涉及的异常符号很多，不限于此，希望各位大佬给点建议！

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

2021-6-8 11:48:19

淦！
本韩国这帮企业起个名字还不好好用英文，真够了

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-6-26 20:22:20

真的是太厉害了

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

相关推荐

栏目导航

热门文章

推荐文章

扫码加好友，拉您进群

各岗位、行业、专业交流群