全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
2515 2
2013-09-28
  sas怎么匹配提取网页中汉字啊?例如匹配此处的‘低于’两个字以及之后3.56% <b class="lower">低于</b><em class="lower">3.56%</em>

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-9-28 15:59:38
路过
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-9-29 08:44:42
目前按下面的语句就可以

%let PrxStringid=%sysfunc(prxparse(/低于<\/b><em class="lower">\d+/));
%let Regrt=%sysfunc(prxmatch(&PrxStringid, 低于</b><em class="lower">3.56%));

%put &Regrt;

但是在“低于”和数字之间的部分如果会有变化的话,需要重写正则
主要问题在于其中含有一些特殊字符,不容易写比较robust的正则

当然,如果不在乎robust的话,用/低于.+\d+/也可以,但是对于长文档,中间的.+会出问题,因为它表示匹配中间任意长的任意字符
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群