全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
4386 2
2018-09-20
悬赏 10 个论坛币 未解决
如以下程序,利用这个编码范围[\xa1-\xff],会将汉字和中文符号都匹配出来,不是楼主想要达到的目的。

问题楼主想要的只是中文的标点符号,或者只要汉字(不包括符号)

希望能人志士给予帮助

复制代码



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-10-31 14:37:37
GB2312汉字
CODE:
[/xb0-/xf7][/xa0-/xfe]

GB2312半角标点符号及特殊符号
CODE:
/xa1[/xa2-/xfe]
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-10-31 21:24:11
一个不幸的消息,  貌似SAS的正则表达式不能很好的支持中文等双字节字符,还是用 perl 吧

If you use the regular-expression-id argument, you cannot process DBCS and MBCS data because the argument requires the PRXPARSE function, which is not DBCS compatible.

https://go.documentation.sas.com/?docsetId=lefunctionsref&docsetTarget=n0bj9p4401w3n9n1gmv6tf*****9m.htm&docsetVersion=3.1&locale=en
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群