全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
3872 2
2021-06-08
如题,本人比较懒,不喜欢把代码搞长,希望有最短的代码把事儿办了。

尝试用以下正则表达式方法处理:
g new_var = ustrregexs(0) if ustrregexm(var,"[0-9A-Za-z\u4e00-\u9fa5]+")


var为原始变量(第一列),new_var 为提取后的变量(第二列)
但是发现只能提取到第一部分,如果有间断就不成功,如下图


QQ截图20210608095642.png QQ截图20210608095616.png
当然,数据中涉及的异常符号很多,不限于此,希望各位大佬给点建议!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2021-6-8 11:48:19
淦!
本韩国这帮企业起个名字还不好好用英文,真够了

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-26 20:22:20
真的是太厉害了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群