全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1824 8
2012-12-07
我在了解用sas抓取网络的上的数据,其中利用正则表达式去除<>部分  , 的代码如下:
data work.temp02;                         

         length content_new $10 flag 8;        
         set work.temp01;        
         retain flag;        flag + 1;        
/*去除所有被<>包含的代码及其所有空格*/      
          pattern2 = 's/<.+?>//s';      
         retain pattern_id;        
         pattern_id = prxparse(pattern2);      
         call prxchange(pattern_id, -1, content);        
           content_new =compress(content);run;
Run;

请问 那个pattern id s/<.+?>//s 是如何解释呀,为什么这样写,那位帮我分解下,好不,谢啦!                                                                                                                                                                                                





二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-12-7 14:56:49
恭喜!再接再厉!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-12-7 15:03:15
's/<.+?>//s'
开始的s表示替换,.匹配除了\n之外的所有字符,+表示匹配1到多次,而?表示匹配模式是非贪婪的,最后将匹配的字符替换为两个斜线//之间的字符,这里为空,起到了删除作用
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-12-7 15:06:16
ziyenano 发表于 2012-12-7 15:03
's///s'
开始的s表示替换,.匹配除了\n之外的所有字符,+表示匹配1到多次,而?表示匹配模式是非贪婪的
非常感谢,如何可以能否再详细些,我刚涉及这部分,还不是很懂
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-12-7 15:24:49
edwardzxf 发表于 2012-12-7 15:06
非常感谢,如何可以能否再详细些,我刚涉及这部分,还不是很懂
http://msdn.microsoft.com/zh-cn/library/ae5bf541(VS.80).aspx
这里正则语法讲得比较全
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-12-7 16:42:47
ziyenano 发表于 2012-12-7 15:24
http://msdn.microsoft.com/zh-cn/library/ae5bf541(VS.80).aspx
这里正则语法讲得比较全
谢谢,难道不同语言程序里的正则表达式的方法都一样不?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群