今天做正则表达式,遇到一个问题。可能是我编错了但不知道错在哪?有没有高手告诉我该怎么改
上面的图是我想用正则表达式提取“.xinhuanet.com/”的英文字符,但电脑却从头开始截取了,我错在哪?如何改?
下面是输入字符:
> red <- "奥运http://www.xinhuanet.com/society"
> red
[1] "奥运http://www.xinhuanet.com/society"
> uyt <- regexpr("\\.[a-z]+\\.[a-z]/",red)
> uyt
[1] -1
attr(,"match.length")
[1] -1
> page <- substr(red,uyt,17)
> page
[1] "奥运http://www.xinh"
>