全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1113 4
2016-04-03

    今天做正则表达式,遇到一个问题。可能是我编错了但不知道错在哪?有没有高手告诉我该怎么改


QQ截图20160403215239.png

上面的图是我想用正则表达式提取“.xinhuanet.com/”的英文字符,但电脑却从头开始截取了,我错在哪?如何改?
下面是输入字符:
> red <- "奥运http://www.xinhuanet.com/society"
> red
[1] "奥运http://www.xinhuanet.com/society"
> uyt <- regexpr("\\.[a-z]+\\.[a-z]/",red)
> uyt
[1] -1
attr(,"match.length")
[1] -1
> page <- substr(red,uyt,17)
> page
[1] "奥运http://www.xinh"
>


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-4-3 22:49:21
uyt <- regexpr("\\.[a-z]+\\.[a-z]+/",red)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-4-4 09:20:23
正则表达式有误,
另外,可以用stringr包来提取:
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-4-4 11:41:25
万人往LVR 发表于 2016-4-3 22:49
uyt
谢谢,这次结果对了。原来我少写了一个“+”。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-4-4 11:43:43
jiangbeilu 发表于 2016-4-4 09:20
正则表达式有误,
另外,可以用stringr包来提取:
谢谢,这个不但好使,而且方便,学习了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群